滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

百度文心5.1模型发布：低成本高成效，五大场景实测展现实力

时间：2026-05-09 22:18:54 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

百度近日推出新一代基础模型文心5.1，在参数压缩和训练成本优化方面取得突破性进展。该模型总参数量缩减至前代的三分之一，激活参数量减少约一半，预训练算力成本仅为行业同规模模型的6%，同时保持了同级别模型中的领先性能。不过，百度未明确说明这一成本数据对比的具体参照范围。

在LMArena最新发布的文本生成大模型排行榜中，文心5.1位列全球第14名，与OpenAI、xAI等头部机构开发的模型存在微小差距。该模型在Agentic能力、知识推理、指令遵循等维度，与DeepSeek-V4-Pro、Claude-Opus-4.6及Gemini-3.1 Pro展开横向对比测试。

具体能力评估显示，文心5.1在工具调用数学推理测试中表现突出，得分仅次于Gemini-3.1 Pro。多轮工具协作交互能力位居第二，与头部模型差距较小。但在深度搜索Agent任务中，电子表格工具操作能力明显落后于Claude-Opus-4.6与Gemini-3.1 Pro，仅在部分指标上优于DeepSeek-V4-Pro。

知识推理与指令遵循测试呈现差异化结果。该模型在高阶学科知识推理和复杂指令遵循任务中表现优异，紧随Gemini-3.1 Pro之后。但在纯数学推理和通用知识问答领域，四款模型中排名末位，与领先者存在显著差距。值得注意的是，文心5.1在发布时登顶国内大模型搜索能力榜首位。

实际场景测试覆盖创意写作、数学推理、信息整合等五个维度。在创意写作方面，思考模型产出的内容在叙事质感和情感表达上优于快速模型，且未出现基础性逻辑错误。数学推理测试中，模型对概率题解答步骤严谨，答案准确。信息整合任务表现突出，能自主拆解模糊需求，生成结构化对比表格。

办公场景测试暴露部分短板。电子表格数据分析任务中，快速模型虽能完成基础操作，但需多次调整指令才达到理想效果。思考模型在首次输出即呈现更规范的结果。编程能力测试成为最大弱点，生成的复杂游戏代码存在运行障碍，小型跑酷游戏代码甚至无法正常启动。

技术架构革新是成本优化的关键。文心5.1采用Once-for-All弹性训练方法，从已训练的子模型矩阵中筛选最优结构，避免重复训练。分离式架构设计将训练、推理等模块独立部署，配合FP8低精度算子库和异构弹性调度技术，使资源利用率提升30%以上。

后训练流程引入并行专家训练机制。先通过统一监督微调建立基础能力，再并行训练代码、推理等领域的专家模型，最后通过在线策略蒸馏实现能力融合。针对创意写作等高熵任务，单独采用强化学习保持输出多样性。这种训练方式使模型迭代周期缩短40%，同时避免能力冲突。

内部评测数据显示，文心5.1的创意写作能力已接近Gemini-3.1 Pro水平。该模型此前多次进入LMArena榜单国产模型第一梯队，此次升级进一步巩固了其在知识推理和指令遵循领域的优势。不过，工具调用深度和复杂表格操作仍需改进，部分场景需要用户反复调整指令才能获得满意结果。

更多>同类资讯

谷歌I/O大会重磅发布Gemini Omni：多模态全能处理，支持一句话编辑视频内容

05-20

谷歌Wear OS 7发布：续航提升10%，智能交互与跨设备体验再升级

05-20

联想moto razr fold大折叠手机登场，高清图赏带你抢先领略科技魅力

05-20

小米澎湃OS 4焕新登场：液态玻璃设计吸睛底层重构助力全场景体验升级

05-20

品牌控价总踩坑？2026电商维权四步实操法，新手也能轻松搞定乱价难题

打开电商平台搜自家产品，却发现一堆低价链接在乱价?未授权店铺随便用品牌图，还卖得比经销商便宜?这种乱象不仅砸牌子，还会逼走正规合作方，简直是品牌成长路上的“绊脚石”。很多品牌把控价简单理解为“把价格压住”或…

05-20

纸尿裤巨头跨界造芯梦碎：20CM跌停背后，高盛踩雷投资者深套

就在今天，延江股份开盘即被死死摁在20CM的跌停板上，收盘定格在15.02元，单日市值蒸发超12亿元！一季报显示，高盛在一季度大举建仓超500万股，如今却只能被动承受股价腰斩的剧痛。对于这种“主业稳健却执意…

05-20

禾赛科技牵手奔驰成L3激光雷达伙伴泰国新厂保障产能一季度业绩飘红

05-20

联想天禧AI 4.0版本发布：仿生记忆、知识库等新功能助力AI升级

05-20

联想AI主机MINI亮相：体积小算力强，功耗仅15W，6月12日预售2999元起

05-20

联想AI主机P7惊艳亮相：如充电宝般小巧，国产此芯P1芯片赋能强大性能

05-20

联想YOGA Air 14 Ultra轻薄本登场：轻至975g，多版本配置满足多样需求

05-20

联想YOGA 360 14变形本登场：超纤手写加持，8500元起开启百变新体验

05-20

摩托罗拉moto razr fold大折叠屏手机亮相：9999元起售，配置亮点十足

05-20

联想2026款小新Air 14来袭！轻薄高配长续航，5499元起开启高效新体验

05-20

摩托罗拉moto razr 70 Ultra小折叠手机亮相：骁龙8至尊版加持 7499元起售

05-20

点击查看更多 +

全站最新

小米YU7 GT纽北创纪录！中国车手任周灿致谢雷军：用速度诠释一切

小米YU7 GT首发V8s EVO超级电机百万级底盘配置5月21日震撼登场

2026中国网络文明大会南宁启幕共话网络文明新篇共绘奋进力量新景

弘信电子2天2板涨44%：Token工厂+算力租赁等多概念加持，后续走势如何？

华为牵手万亿央企中国中化，跨界合作打造产业升级“新引擎”

小米跨界造车突破材料科学边界，AI赋能自研合金斩获行业大奖！

热门内容

本栏最新

谷歌I/O大会重磅发布Gemini Omni：多模态全能处理，支持一句话编辑视频内容

品牌控价总踩坑？2026电商维权四步实操法，新手也能轻松搞定乱价难题

纸尿裤巨头跨界造芯梦碎：20CM跌停背后，高盛踩雷投资者深套

小米YU7 GT纽北创纪录！中国车手任周灿致谢雷军：用速度诠释一切

小米YU7 GT首发V8s EVO超级电机百万级底盘配置5月21日震撼登场

弘信电子2天2板涨44%：Token工厂+算力租赁等多概念加持，后续走势如何？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.