滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

文心5.1模型发布：成本大降性能提升，五大场景实测见真章

时间：2026-05-10 18:48:18 来源：天脉网编辑：快讯 IP：北京 发表评论无障碍通道

百度近日宣布推出新一代基础模型文心5.1，在模型压缩和训练成本优化方面取得突破性进展。该模型总参数量缩减至前代的三分之一，激活参数量压缩约50%，预训练成本仅为同规模业界模型的6%，同时保持了同级别模型中的领先性能。这一成果得益于百度自主研发的Once-for-All弹性训练方法，通过动态采样技术实现单次预训练生成覆盖多种参数规模的子模型矩阵。

在LMArena最新发布的文本生成大模型排行榜中，文心5.1以全球第14位的成绩跻身前列。该模型在Agentic能力测试中展现出不俗表现，工具调用数学推理得分紧随Gemini-3.1 Pro位列第二，多轮工具协作交互能力与Claude-Opus-4.6差距微小。不过在深度搜索Agent任务中，电子表格工具操作能力较头部模型存在明显差距，仅在基础操作层面领先DeepSeek-V4-Pro。

知识推理与指令遵循能力测试显示，文心5.1在高阶学科知识推理（GPQA）和复杂指令遵循（AdvanceIF）两个维度表现突出，仅次于Gemini-3.1 Pro。但在纯数学推理（AIME26）和通用知识问答（MMLU-Pro）测试中，该模型在四款对比模型中排名末位，与头部产品存在显著性能差异。这种能力分布特点在创意写作场景中同样有所体现，虽然叙事风格和情感表达获得认可，但故事框架创新性仍显不足。

实际场景测试中，文心5.1展现出差异化的能力表现。在高考数学题解答场景，模型通过指示变量法和分布法给出完全正确的解答步骤；信息整合任务中，能自主拆解模糊需求生成结构化对比表格，并提供场景化使用建议。电子表格操作测试显示，虽然基础数据处理能力达标，但复杂表格生成仍需多次指令修正。编程能力测试暴露明显短板，生成的3D格斗游戏代码存在界面遮挡和交互失效问题，横版跑酷游戏代码则完全无法运行。

技术架构层面，文心5.1采用分离式模块设计，将训练、推理、奖励计算和智能体循环四个核心环节独立部署。通过FP8低精度算子库优化和异构弹性调度技术，模型在保持训练稳定性的同时，将CPU闲置算力利用率提升30%。后训练流程创新采用"专家训练-能力融合"双轨机制，通过在线策略蒸馏技术实现代码、推理等确定性能力的高效迁移，同时保留开放式任务的强化学习通道。

内部评测数据显示，文心5.1的创意写作能力已接近Gemini-3.1 Pro水平。该模型在国产大模型阵营中持续保持领先地位，其低成本训练方案为行业提供了新的发展路径。不过在工具调用深度和复杂办公场景适应性方面，仍需通过后续迭代缩小与国际头部模型的差距。

更多>同类资讯

算力热潮下电力股受关注！外资布局电力板块，高盛重仓11家潜力股

06-04

阿迪达斯“进城办事”T恤444元一件，网友直呼：这“事”儿有点大！

06-04

字节跳动Seed架构再调整：Robotics团队归周畅管资源集中促协同

06-04

港股IPO保荐人格局：中金公司71个项目领跑，多家券商各有表现

06-03

A股算电协同“低调王者”：全球第一却横盘三年，高盛摩根押注何方？

06-03

AI医疗概念股低位盘整多年，章盟主与社保基金携手布局有何深意？

06-03

AI创投新势力：00后闯入“世界模型”赛道，资本热捧下隐忧何在？

06-03

安卓iOS正式互通：小米、vivo等支持与iPhone隔空投送

06-03

AI谄媚警报：“你绝对正确”让企业CEO容易患上“AI精神病”

06-03

赛力斯字节合作新车品牌智驾方案商预计为元戎启行

06-03

张一鸣成亚洲第二大富豪：净资产928亿美元

06-03

月之暗面Kimi Work Beta版开启内测：自然语言指挥电脑干活

06-03

字节跳动TikTok产品战略负责人海峰离职

06-03

先理解再动手！字节开源统一框架 Bernini，让 AI 视频编辑告别“碰运气”

06-03

谷歌发布Gemma 4，E2B架构让手机本地跑AI现质变

06-03

点击查看更多 +

全站最新

生产制造项目经理求职指南：行业趋势洞察与靠谱招聘平台推荐

亚马逊云科技AI新进展：不拼模型炫技，专注企业AI落地真实需求

驭势科技吴甘沙：历经芯片创新“死亡谷”，十年磨剑终迎自动驾驶曙光

小米17T系列6月8日发布：首发徕卡live动态照，双画质水印加持影像新体验

粤港澳车展“最”车型盘点：小米奥迪领衔，性能豪华代步款款有亮点

豪美新材携高端轻量化铝基材料亮相大湾区车展切入新能源供应链

热门内容

本栏最新

亚马逊云科技AI新进展：不拼模型炫技，专注企业AI落地真实需求

驭势科技吴甘沙：历经芯片创新“死亡谷”，十年磨剑终迎自动驾驶曙光

小米17T系列6月8日发布：首发徕卡live动态照，双画质水印加持影像新体验

粤港澳车展“最”车型盘点：小米奥迪领衔，性能豪华代步款款有亮点

雄魂美学遇上华为乾崑！全新猛士M817预售37万起，解锁越野新境界

AI模型能力趋同，企业如何跨越断层，让AI真正“上岗”成可靠员工？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.