在深度学习领域持续发力的百度,于近期举办的开发者大会上重磅推出文心大模型X1.1版本。这款依托文心4.5架构训练的深度思考模型,通过创新性的迭代式混合强化学习框架,在事实准确性、指令遵循能力和智能体交互水平三大核心指标上实现显著突破,分别提升34.8%、12.5%和9.6%,标志着国产大模型技术迈入新阶段。
新模型在复杂任务处理中展现出卓越能力。面对创意写作场景,其内置知识库与联网搜索工具深度协同,可生成逻辑严密、文采斐然的文本内容;当处理共享单车用户情绪化咨询时,模型能自动规划解决方案并调用相关工具,在极短时间内完成全流程服务。权威第三方评测显示,该模型整体性能已超越DeepSeek R1-0528,在部分专业任务中达到国际顶尖水平,与GPT-5、Gemini 2.5 Pro等国际标杆模型持平。
配套生态建设方面取得里程碑式进展。飞桨文心生态已吸引2333万开发者入驻,服务企业数量突破76万家。大会现场发布的"AI助老公益计划"引发广泛关注,该计划通过百度搜索和小度智能健康屏部署的"AI助老智能体",为老年群体提供便捷的数字化服务。同步推出的"文心导师·星耀计划"汇聚行业顶尖资源,其中48%的导师拥有十年以上从业经验,41%为专业技术人员,构建起高质量的数据指导体系。
在数字人技术领域,百度推出的剧本驱动多模协同方案成为行业焦点。该技术将语言、声音和形象生成模块有机整合,实现动态交互与深度思考的深度融合。实际应用中,慧播星平台孵化的数字人主播已展现出超越真人的带货能力,罗永浩数字人直播首秀即创下行业GMV新纪录,部分品类销售量超越真人主播表现。
框架层面,飞桨v3.2版本通过计算优化、并行策略和容错机制三大技术升级,将ERNIE-4.5-300B-A47B模型的预训练效率提升至47% MFU。该版本实现92%的类CUDA芯片算子复用率,兼容Safetensors权重体系,显著降低模型部署成本。配套推出的FastDeploy部署套件,使大模型在50ms时延下达到57K tokens/秒的输入吞吐量,为大规模商用奠定基础。
科研领域迎来双突破:PaddleCFD和PaddleMaterials科学计算套件可大幅提升流体力学与材料科学研发效率;GraphNet计算图数据集提供2700余个标准化模型图,填补AI编译器测试基准空白。大会现场开源的ERNIE-4.5-21B-A3B-Thinking思考模型,在内容创作、逻辑推理等任务中表现优异,为科研人员提供强大工具支持。
开发工具链持续完善。文心快码3.5S版本强化多智能体协同能力,开创"一人即团队"的新型开发模式。数据显示,该工具已服务超千万开发者,百度内部45%的新增代码由AI生成,头部企业用户的AI代码产出比例更高达75%。中国科技馆联合发布的智能体矩阵,整合全国28家科技馆资源,推动科普服务向智能化、个性化方向升级。