ITBear旗下自媒体矩阵:

月之暗面Kimi-Researcher登顶HLE,AI智能体新强者来袭!

   时间:2025-06-23 11:10:01 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

月之暗面公司今日震撼发布其备受瞩目的Kimi研究功能,正式进军竞争激烈的AI智能体领域。据悉,该功能在多项严格测试中展现出了卓越性能,特别是在“人类终极考验”(HLE)测试中,以压倒性优势超越了谷歌与OpenAI的同类产品,荣登榜首。

Kimi研究功能的核心竞争力在于其自主研发的Kimi-Researcher智能体,这款智能体在多轮搜索与推理方面展现出了非凡的能力。据统计,Kimi-Researcher在执行任务时,平均会执行23个推理步骤,并浏览超过200个相关网页,其强大的信息处理与分析能力令人瞩目。

在HLE测试中,Kimi-Researcher基于Kimi k-系列模型的内部版本构建,并通过端到端的智能体强化学习进行训练。其Pass@1得分率达到了26.9%,Pass@4准确率更是高达40.17%,刷新了业界记录。尤为Kimi-Researcher的HLE初始得分仅为8.6%,经过强化学习训练后,成绩实现了质的飞跃,这充分证明了端到端智能体强化学习在提升智能体智能水平方面的巨大潜力。

Kimi-Researcher在多个复杂且具有挑战性的真实世界基准测试中同样表现出色。在xbench测试的xbench-DeepSearch项目上,Kimi-Researcher取得了69%的Pass@1得分率(四次运行平均值),优于其他配备搜索工具的模型。在涉及多轮搜索推理(如frameS、Seal-0)和事实性信息问答(如SimpleQA)的基准测试中,Kimi-Researcher同样展现出了卓越的性能。

为了让更多用户能够体验到Kimi-Researcher的强大功能,月之暗面公司宣布,即日起将逐步向用户开放内测申请。用户只需访问kimi.com即可提交申请。更令人期待的是,月之暗面公司计划在未来几个月内开源Kimi-Researcher背后的基础预训练模型以及经过强化学习训练后的模型,这将为AI社区的发展注入新的活力。

感兴趣的用户可以访问月之暗面公司的GitHub页面(https://moonshotai.github.io/Kimi-Researcher/),了解更多关于Kimi-Researcher的详细信息。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version