滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Vercel CEO实测：Kimi K2智能体场景运行速度超GPT5等5倍，准确率领先50%

时间：2025-10-21 22:13:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近日，美国科技公司Vercel首席执行官吉列尔莫在一篇技术分析文章中披露，其内部研发的智能体测试框架对多款主流大模型进行了实景任务性能评估。结果显示，中国团队开发的开源模型Kimi K2在效率与精度方面展现出显著优势，引发行业对开源模型技术突破的关注。

根据公布的测试数据，在涉及复杂逻辑推理与多步骤操作的场景中，Kimi K2完成任务的平均耗时仅为2分钟，较GPT5的8分钟和Claude Sonnet4.5的10分钟缩短80%。精度表现方面，该模型达到62%的任务完成准确率，分别超出GPT5（38%）和Sonnet4.5（47%）24和15个百分点。这种量级的技术代差在高端模型对决中较为罕见。

值得关注的是，Vercel团队特别强调了Kimi K2与现有技术栈的兼容特性。通过标准化接口设计，开发人员可在不修改底层架构的前提下，实现模型的无缝切换。这种"即插即用"的特性，结合开源社区的持续迭代能力，为中小企业采用先进AI技术提供了可行路径。

行业分析师指出，此次测试结果打破了"闭源模型必然领先"的固有认知。虽然测试场景具有特定性，但Kimi K2在关键指标上的突破，证明开源生态通过架构创新与工程优化，完全有能力在特定领域实现技术反超。随着更多企业加入开放技术协作，AI领域的竞争格局或将迎来新的变量。

更多>同类资讯

谷歌Gemini 3将发布，能否借此改写AI格局引行业关注

11-17

阿里Qwen Code v0.2.1上线，实用与效率双提升，开启AI工程化新篇

11-17

阿里“千问”APP公测上线，以先进模型打造AI生活新入口

11-17

阿里千问APP：以AI原生应用之姿，探寻中国C端超级入口新路径

11-17

阿里巴巴“千问”APP公测版上架，朱啸虎盛赞或成AI生活新入口

11-17

小米超级小爱AI大模型“随心修图”上线，一句话轻松实现照片风格变换

11-17

商汤医疗再获数亿元融资蓄力加码开启新征程启航盛典

11-17

阿里巴巴发布千问App公测版，凭Qwen3模型强势入局AI to C市场

据了解，千问App公测版目前已在各大应用商店上架，并同步提供网页和PC版。自2023年全面开源以来，阿里Qwen已经超越Llama、Deepseek等模型，成为全球性能最强、应用最广泛的开源大模型。据透露…

11-17

阿里千问App公测上线，以开源模型为基剑指全球AI to C市场

阿里千问Qwen是全球第一开源模型，模型性能媲美顶级的闭源模型，已成为开发者和企业级市场的首选。基于全球领先的AI云计算基础设施，从全球第一的开源模型，到覆盖全球的App应用，阿里正以千问Qwen为核心出击…

11-17

全国“人工智能+”创新大赛在蓉启幕成都项目多点开花展现硬核实力

11月14日，百模论剑·第二届全国“人工智能+”行业应用创新大赛颁奖暨人工智能赋能新型工业化深度行（成都站）启动大会在成都举办。大赛评出了一等奖5项、二等奖7项、三等奖13项，来自成都的多个项目获奖。本届大…

11-17

阿里千问APP公测开启，对标ChatGPT，生活多场景接入引期待

千问APP公测版使用的核心模型，是阿里最新版的Qwen3系列。在今年9月召开的2025云栖大会上，阿里最新发布了旗舰模型Qwen3-Max，其性能指标超越GPT5、ClaudeOpus 4等国际主流模型，…

11-17

具身智能新突破！我国首个手语交互系统机器人适配多款灵巧手

据介绍，这是搭载了我国首个手语交互系统的具身智能机器人，通过具身智能模型，可以让普通的具备灵巧手功能的机器人，拥有手语的交互能力。作为科研项目，团队从 2008 年就开始设计这套手语库，随着具身智能的发展…

11-17

智能驱鸟机器人亮相杭州机场：AI赋能，筑牢航空安全新防线

近日，一款名为“智能驱鸟机器人”的系统在杭州萧山国际机场投入实际应用，其独特的运作模式和技术集成，引发了业界的广泛关注。机场驱鸟机器人的成功应用，是申昊科技将其技术积累从传统工业领域，延伸至航空安全这一特殊…

11-17

OpenAI新研究：以稀疏模型探索语言机制铺就理解模型内部行为新路径

与普通模型不同，OpenAI发现可以从该稀疏模型中提取出简单、易于理解的部件来执行特定任务，例如在代码中正确结束字符串或跟踪变量类型。对于简单行为，OpenAI 发现使用其方法训练的稀疏模型包含小型、解耦…

11-17

AI泡沫论遭驳斥！周鸿祎：泡沫与革命并存，AI正催生真实变革

文章给出一组数据，95%的公司用AI都在亏钱，OpenAI半年就烧了135亿，但英伟达的市值却被炒到了5万亿美元。这些基础设施就像2000年互联网泡沫留下的光纤和数据中心一样。周鸿祎判断，我们正处在泡沫中…

11-17

点击查看更多 +

全站最新

中国电车别再只卷价格！山姆模式或成破局新思路

吉利旗下上海吉津机电设备公司注销

上拉如今年5月退出与小英关联公司

广东顺丰电子商务公司增资至4亿增幅3900%

华润雪花啤酒长春公司注销

奇瑞汽车增资至约58.1亿增幅约6%

热门内容

本栏最新

东风奕派eπ007+深圳焕新登场：14万级激光雷达加持，四驱轿跑新选择

24.9万起售！全新奔驰纯电CLA携四大突破，重塑豪华纯电新标杆

东风奕派两周年献礼，eπ007+携四大优势登场，助力新能源赛道加速跑

东风奕派两周年献礼：eπ007+携四大优势登场，为年轻人出行注入新动力

东风奕派eπ007+高能登场，以“奕派速度”为年轻人解锁百万级出行新体验

岚图泰山来袭：外观大气内饰豪华能否在高端SUV市场分一杯羹？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.