ITBear旗下自媒体矩阵:

“问小白”XBai o4开源大模型发布,复杂推理能力再创新高

   时间:2025-08-05 02:26:08 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在开源大模型技术的浪潮中,“问小白”项目近期宣布了一项重大进展——正式推出了其最新的第四代开源模型XBai o4。这款模型在复杂推理能力方面取得了显著突破,特别是在Medium模式下,其表现已经超越了OpenAI的o3-mini模型,并且在部分基准测试中,甚至优于Anthropic的Claude Opus。

XBai o4之所以能够在复杂推理领域大放异彩,关键在于其独创的“反思型生成范式”。这一创新技术结合了Long-CoT强化学习与过程评分学习,使得模型能够像人类一样进行多步骤的复杂思考,并且能够在思考过程中评估和选择最优的推理路径。这种范式不仅提升了模型的推理深度,还显著优化了推理链路的筛选效率。

XBai o4通过共享过程评分模型(PRMs)和策略模型的主干网络,实现了过程评分推理耗时的极大降低,降幅高达99%。这一优化措施无疑为模型的实际应用提供了强有力的支持,使得XBai o4在保持高性能的同时,也能够保持高效的运行状态。

在性能表现方面,XBai o4同样令人瞩目。该模型提供了low、medium、high三种模式,以适应不同复杂度的任务需求。在多项关键基准测试中,XBai o4均展现出了卓越的推理能力。无论是在AIME24、AIME25这样的专业测试中,还是在LiveCodeBench v5、C-eval等实际应用场景中,XBai o4都以其出色的表现赢得了广泛的认可。

为了更好地推动开源大模型技术的发展,“问小白”项目还决定将相关的训练和评估代码在GitHub上开源。这一举措不仅为AI研究社区提供了宝贵的资源,也进一步彰显了“问小白”在开源大模型领域的领先地位。感兴趣的研究人员和开发者可以通过访问https://github.com/metaStone-AI/XBai-o4,获取更多关于XBai o4的信息和资源。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version