ITBear旗下自媒体矩阵:

文心大模型4.5 Turbo技术创新揭秘:百度吴甜讲述AI新突破

   时间:2025-05-20 20:06:39 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在北京近日举办的百度AI Day活动中,中国信息通信研究院揭晓了一项关于大模型推理能力的权威评估结果。结果显示,百度推出的文心X1 Turbo在众多评估项目中表现卓越,其中16项获得满分5分,7项获得4分,仅1项为3分,综合评级达到了当前最高的“4+级”。这一成绩标志着文心X1 Turbo成为国内首个通过该严格测评的大模型,特别是在逻辑推理、代码推理以及推理效果优化等方面,均展现出顶尖的技术实力,同时其工具支持度和安全可靠度也赢得了满分评价。

活动中,百度技术专家吴甜详细介绍了文心大模型最新版本的技术创新。她提到,文心大模型4.5作为一款多模态基础大模型,其升级版文心4.5 Turbo在效果和成本上均实现了显著提升。基于文心4.5 Turbo,文心X1升级为X1 Turbo,不仅在性能上有了质的飞跃,还配备了更先进的思维链技术,使得问答、创作、逻辑推理、工具调用以及多模态能力均得到了进一步增强。

文心4.5及4.5 Turbo在混合训练方面取得了显著突破,实现了文本、图像和视频数据的无缝融合。针对不同模态数据在结构、规模和知识密度上的差异,百度采用了多模态异构专家建模、自适应分辨率视觉编码等一系列先进技术,使得跨模态学习效率大幅提升近2倍,多模态理解效果也提高了超过30%。

在后训练阶段,百度研发了自反馈增强的技术框架,通过大模型自身的生成和评估能力,构建了一个“训练-生成-反馈-增强”的闭环迭代机制。这一机制不仅解决了对齐过程中数据生产难、成本高、速度慢等问题,还有效降低了模型幻觉现象,显著提升了模型理解和处理复杂任务的能力。

在训练阶段,百度通过融合偏好学习的强化学习技术,实现了对结果质量判别的准确提升。通过离线偏好学习和在线强化学习的统一优化,进一步提高了数据利用效率和训练稳定性,同时增强了模型对高质量结果的感知能力。通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等综合能力均得到了全面提升。

在深度思考方面,百度突破了传统思维链优化的局限,构建了融合思考和行动的复合思维链。这一创新使得模型在解决问题时能够结合工具调用,从而显著提升了问题解决能力。模型输出的结果不仅思路清晰、逻辑严密,而且表达自然流畅。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

在数据建设方面,百度打造了一个从数据挖掘与合成到数据分析与评估再到模型能力反馈的闭环数据建设体系。这一体系为模型训练提供了源源不断的高质量数据支持,涵盖了知识密度高、类型多样、领域覆盖广的数据资源。同时,数据建设流程具备良好的可扩展性,能够轻松适应全新的数据类型,实现快速高效的数据生产。

吴甜还指出,随着大模型能力的进一步拓展和效率的提升,百度正在探索更多具有前瞻性和想象力的创新应用。以数字人为例,百度通过“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音和形象的完美协调一致。目前,这一技术已经支持超过10万数字人主播,直播转化率高达31%,同时降低了80%的直播开播成本。在代码场景上,百度基于文心大模型的语言和代码能力,研制了代码智能体和智能代码助手——文心快码。如今,百度每天新增的代码中,由文心快码生成的代码占比已超过40%,并已累计服务了760万开发者。

文心大模型的能力拓展和效率提升,离不开飞桨文心的联合优化。通过框架模型和框架算力的联合优化,文心4.5 Turbo的训练吞吐达到了文心4.5的5.4倍,推理吞吐更是达到了8倍。数据显示,飞桨文心的开发者数量已超过2185万,服务了超过67万家企业,创建了110万个模型。基于飞桨深度学习平台和文心大模型,百度在上海、广州、南京等多个城市落地了产业赋能中心、数据生态中心和教育创新中心,以科技+人才+创新的模式打造区域人工智能公共技术服务平台,汇聚行业高价值数据集、培养新型复合型人才、赋能本地AI产品研发,构建围绕人工智能核心能力的“政产学研用”协同发展机制,助力区域产业智能化升级。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version