滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

“问小白”XBai o4开源大模型发布，复杂推理能力再创新高

时间：2025-08-05 02:26:08 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

在开源大模型技术的浪潮中，“问小白”项目近期宣布了一项重大进展——正式推出了其最新的第四代开源模型XBai o4。这款模型在复杂推理能力方面取得了显著突破，特别是在Medium模式下，其表现已经超越了OpenAI的o3-mini模型，并且在部分基准测试中，甚至优于Anthropic的Claude Opus。

XBai o4之所以能够在复杂推理领域大放异彩，关键在于其独创的“反思型生成范式”。这一创新技术结合了Long-CoT强化学习与过程评分学习，使得模型能够像人类一样进行多步骤的复杂思考，并且能够在思考过程中评估和选择最优的推理路径。这种范式不仅提升了模型的推理深度，还显著优化了推理链路的筛选效率。

XBai o4通过共享过程评分模型（PRMs）和策略模型的主干网络，实现了过程评分推理耗时的极大降低，降幅高达99%。这一优化措施无疑为模型的实际应用提供了强有力的支持，使得XBai o4在保持高性能的同时，也能够保持高效的运行状态。

在性能表现方面，XBai o4同样令人瞩目。该模型提供了low、medium、high三种模式，以适应不同复杂度的任务需求。在多项关键基准测试中，XBai o4均展现出了卓越的推理能力。无论是在AIME24、AIME25这样的专业测试中，还是在LiveCodeBench v5、C-eval等实际应用场景中，XBai o4都以其出色的表现赢得了广泛的认可。

为了更好地推动开源大模型技术的发展，“问小白”项目还决定将相关的训练和评估代码在GitHub上开源。这一举措不仅为AI研究社区提供了宝贵的资源，也进一步彰显了“问小白”在开源大模型领域的领先地位。感兴趣的研究人员和开发者可以通过访问https://github.com/metaStone-AI/XBai-o4，获取更多关于XBai o4的信息和资源。

更多>同类资讯

孙宇晨：删掉「90前」联系人，勿沾老登气息

02-22

宇树科技王兴兴谈机器人：技术进步快，大规模应用或3至10年可期

02-22

AI赋能可信数据空间：2026年驱动数字经济跃升与跨域协同创新新路径

2026年人工智能赋能可信数据空间发展研究报告指出，数据作为数字经济核心生产要素，其高效流通面临“不愿、不敢、不会共享”的难题，可信数据空间成为破解数据孤岛的关键，而人工智能技术则为其建设提供了核心驱动力，…

02-22

Cursor从巅峰到静默：AI叙事狂飙下，技术王者为何难逃被遗忘？

02-22

AI狂潮下泡沫疑云：54位科技与投资界大咖如何看待？

02-22

三星Galaxy S26 Ultra宣传材料流出：相机电池配置揭晓新特性引关注

值得注意的是，Galaxy S26 Ultra 预计将采用圆润的边框设计，配备独立的相机岛，搭载三摄系统，并提供全黑配色（包括边框）。与此同时，作为 Galaxy S26 Ultra 的亮点之一，三星将为其…

02-22

三星Galaxy S26 Ultra宣传材料流出相机电池配置揭晓隐私屏等亮点引关注

02-22

马修·麦康纳谈AI冲击影视业：演员或被取代，奥斯卡或添新奖项类别

02-22

AI淘金热催生“影子电网”：美国数据中心自发电背后的环境隐忧与争议

02-22

马修·麦康纳担忧AI渗透影视业：演员或被取代，奥斯卡或添新奖项类别

02-22

三星Galaxy S26系列携手Perplexity AI，打造多智能体协同新体验

三星的战略并非将用户锁定在单一助手或体验中，而是致力于构建一个开放的多智能体生态系统，让不同的 AI 服务能够在同一设备上协同共存。三星方面着重指出，其 Galaxy AI 的独特优势在于它在框架和操作系统…

02-22

OpenAI调整策略：算力支出目标降至6000亿，推进千亿融资谋长远发展

02-22

三星Galaxy S26携Perplexity AI亮相，智能助手升级开启高效新体验

02-22

2026法国农博会巴黎启幕：智能机器人、美食与马术精彩纷呈

02-22

OpenAI CEO奥尔特曼：ChatGPT单次提问耗水“荒谬”，能效或已追平人类

02-22

点击查看更多 +

全站最新

春节返程高峰将至，避开这些“雷区”，安全驾驶助你顺利归程

返程路上年味浓，拒绝分心驾驶，握紧方向盘守护平安归途

丰田新款YARIS亮相！标配升级，Z URBANO版首推6MT，驾驶乐趣拉满

北欧纯电新标杆！沃尔沃ES90携800V快充登场，续航稳、安全强，上半年见

春晚机器人成新宠：“仿生蔡明”赠真身，“熊猫款”高价落槌引热议

中国巨佬最新持仓！两家公司成最大共识

热门内容

本栏最新

中国芯片实力获认可：丰田铃木等外企选用，成本品质双重优势凸显

黄仁勋预热GTC 2026：将推“世界前所未见”芯片突破技术极限引期待

黄仁勋预热GTC 2026：将推“世界未见”芯片突破技术极限引期待

黄仁勋预热GTC 2026：将推“世界前所未见”芯片突破技术极限再领跑

黄仁勋预热GTC 2026：全新芯片将至英伟达突破极限再领跑AI算力

从对话到实干：豆包大模型2.0化身全能助手，多领域展现惊人动手能力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.