在近期举办的WAVE SUMMIT深度学习开发者大会上,百度宣布了一系列技术突破与产品升级,涵盖大模型、深度学习框架及智能开发工具等多个领域。其中,文心大模型X1.1的发布成为焦点,该模型通过迭代式混合强化学习框架,在事实准确性、指令遵循能力及智能体交互水平上实现显著提升,较前代版本分别提高34.8%、12.5%和9.6%。
文心大模型X1.1的升级路径基于文心4.5版本,采用自蒸馏数据迭代生产与训练技术,兼顾通用任务与智能体任务的优化效果。目前,该模型已通过百度智能云千帆平台向企业客户及开发者开放,同时支持文心一言官网和文小言APP的终端应用。在权威基准测试中,X1.1整体表现超越DeepSeek R1-0528,并在部分任务中与GPT-5、Gemini 2.5 Pro持平。
现场演示环节,X1.1展现了处理复杂任务的能力。例如,在创意写作场景中,模型结合内化知识与联网搜索工具,生成结构清晰、逻辑严谨且文辞优美的内容;在长程任务场景中,面对共享单车平台用户的多维度问题,模型能自主规划流程、调用工具并感知用户情绪,快速完成服务闭环。
深度学习框架层面,飞桨(PaddlePaddle)v3.2版本同步发布,重点优化训练效率与部署成本。该版本在ERNIE-4.5-300B-A47B模型上实现47%的预训练MFU,类CUDA芯片算子内核复用率达92%,并兼容Safetensors权重生态。配套推出的大模型高效部署套件FastDeploy,通过模型压缩与服务协同优化,使ERNIE-4.5-300B-A47B在50ms时延下达到57K tokens/秒的输入吞吐量和29K tokens/秒的输出吞吐量。
科研领域工具链亦获扩展,PaddleCFD与PaddleMaterials两大科学计算套件可提升流体力学和材料科学的研发效率。同时,百度开源ERNIE-4.5-21B-A3B-Thinking模型,该模型在内容创作、逻辑推理、数学计算及代码生成等任务中表现突出。ERNIEKit开发套件则通过4张GPU即可实现ERNIE-4.5-300B-A47B模型的高效调优,并开源超2700个模型计算图的大规模数据集GraphNet,填补AI编译器测试基准的空白。
智能开发工具方面,文心快码升级至3.5S版本,引入多智能体自协同机制,支持动态生成智能体团队完成复杂任务。该版本通过构建统一经验库实现团队知识传承,目前服务开发者超1000万。百度内部数据显示,AI生成代码占比达45%,其中前10%的Agent用户AI生成比例超过75%。