由深度学习技术及应用国家工程研究中心主办、百度飞桨与文心大模型联合承办的WAVE SUMMIT深度学习开发者大会近日在北京落幕。会上,百度集中发布文心大模型X1.1、飞桨框架v3.2及ERNIEKit开发套件等系列技术成果,同步展示大模型在内容创作、智能交互、科学计算等领域的创新应用,引发行业广泛关注。
百度首席技术官王海峰在会上宣布,基于文心大模型4.5训练的深度思考模型X1.1正式上线。该模型采用迭代式混合强化学习框架,通过自蒸馏数据迭代优化,在事实准确性、指令遵循能力及智能体交互效率三大核心指标上实现突破性提升。测试数据显示,其事实性准确率较前代提高34.8%,指令遵循能力提升12.5%,智能体交互效率增长9.6%。目前,该模型已通过文心一言官网、文小言APP及百度智能云千帆平台全面开放,企业客户与开发者可自由调用。
在性能基准测试中,文心大模型X1.1展现强劲竞争力。其整体性能超越DeepSeek R1-0528,在复杂逻辑推理、多模态内容生成等任务中达到国际顶尖水平,部分指标与GPT-5、Gemini 2.5 Pro持平。这一突破得益于飞桨框架与文心大模型的深度联合优化,通过计算效率提升、硬件适配强化及生态支持完善,推动模型能力持续进化。
同步发布的飞桨框架v3.2聚焦大模型训练与部署效率提升。该版本实现三大核心升级:计算优化突破大模型训练技术瓶颈,在ERNIE-4.5-300B-A47B模型上预训练MFU达47%;类CUDA芯片适配率提升至92%,兼容Safetensors权重及生态加速库;推出大模型高效部署套件FastDeploy,通过模型压缩与推理协同优化,使ERNIE-4.5-300B-A47B模型在50ms时延下实现输入57K tokens/秒、输出29K tokens/秒的高性能。AI科学计算套件PaddleCFD与PaddleMaterials可显著提升流体力学与材料科学研发效率。
百度集团副总裁吴甜现场演示了文心大模型X1.1的实际应用场景。在复杂写作任务中,模型可自动调用联网搜索工具获取权威信息,结合深度思考能力生成逻辑严密、文辞优美的内容;在长程任务处理中,模型能根据用户情绪与业务流程自主调用工具,快速解决问题。以数字人直播为例,百度研发的剧本驱动多模协同技术通过语言、声音与形象的精准协调,实现“高情商、强互动、长续航、更专业”的直播效果。此前,罗永浩数字人直播首秀GMV创行业新高,部分品类带货量超越真人主播。
在数据生态建设方面,文心导师计划持续深化。目前,导师团队中10年以上行业专家占比48%,专业技术及教职人员占比41%。大会发布的“文心导师·星耀计划”将依托飞桨文心生态资源,联合行业精英推动AI技术落地。同时,中国科技馆与百度共建的“科技馆智能体矩阵”正式上线,联动全国28家科技馆与340名开发者,实现跨馆资源聚合与智能协同,助力科普服务智能化升级。
针对开发者需求,百度开源ERNIE-4.5-21B-A3B-Thinking深度思考模型,在内容创作、逻辑推理、数学计算等任务中表现卓越。ERNIEKit开发套件提供4张GPU即可调优ERNIE-4.5-300B-A47B模型的便捷方案,并开源大规模计算图数据集GraphNet,填补AI编译器测试基准空白。文心快码3.5S版本升级多智能体协同能力,实现“一人即团队”开发模式,已服务超1000万开发者。数据显示,百度内部45%新增代码由AI生成,前10%用户AI完成比例超75%。
据最新统计,飞桨文心生态开发者规模达2333万,服务企业76万家。通过技术突破与生态共建,百度正推动大模型从实验室走向千行百业,为数字化转型注入新动能。