ITBear旗下自媒体矩阵:

文心大模型5.0正式版上线:原生全模态建模,引领全球AI新潮流

   时间:2026-01-22 22:36:43 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在百度文心Moment大会上,一款具有里程碑意义的大模型——文心大模型5.0正式版宣布上线。这款模型参数规模高达2.4万亿,采用原生全模态统一建模技术,实现了对文本、图像、音频、视频等多种信息的全面理解与生成能力,标志着人工智能技术迈向新的高度。

与传统多模态模型采用“后期融合”方案不同,文心5.0通过统一的自回归架构进行原生全模态建模。该技术路线将多源数据在同一模型框架中联合训练,使多模态特征在统一架构下深度融合并协同优化。这种创新设计不仅提升了模型对复杂场景的理解能力,还实现了原生全模态的统一生成。在权威基准评测中,其语言与多模态理解能力稳居国际第一梯队,图像与视频生成能力达到垂直领域专精模型水平,整体性能处于全球领先地位。

技术架构方面,文心5.0采用超大规模混合专家结构,激活参数比低于3%。这种设计在保持模型强大能力的同时,显著提升了推理效率。通过大规模工具环境合成训练数据,并运用基于思维链和行动链的端到端多轮强化学习,模型的智能体和工具调用能力得到质的飞跃。这些突破使得模型在多模理解、代码生成、创意写作等关键领域实现显著提升。

百度应用模型研发部负责人贾磊在会上展示了三项突破性技术:基于声音Token的端到端合成大模型、5分钟生成超越真人效果的直播技术,以及实时交互数字人技术。其中,实时交互数字人采用三态Token联动架构,实现文本、语音、视频的流式控制。该技术突破传统数字人模态串联模式,通过系统自动完成动作衔接与状态重组,由声音Token实时驱动表情与口型,输出三态合一的视频流。这项技术具有低延迟、低成本和高表现力的特点,百度罗永浩数字人即基于此技术开发。

为推动技术落地,百度千帆平台同步支持企业用户和开发者便捷调用文心5.0正式版。平台提供的Agent Infra解决方案涵盖模型、工具、开发、数据及运行环境五个层面。在模型服务方面,提供包括文心5.0在内的150余个全场景SOTA模型,并针对Agent场景开发精准思维链控制等增强服务。工具服务层面,通过MCP协议开放百度AI搜索、地图、文库等成熟AI能力,同时引入出行、支付等企业级高频需求的第三方能力。

开发服务方面,千帆平台凝聚百度工程师实战经验,开放企业级深度研究Agent等多款官方应用。数据服务通过智能平台将非结构化数据转化为模型可理解信息,实现多模态数据统一管理及算力混合调度,数据处理效率提升6倍,计算成本降低30%。运行环境则提供完善的资源部署、权限管理及监控工具链,确保智能体在业务场景中的稳定运行。目前,千帆平台上已累计开发超过130万个Agents,展现出强大的生态构建能力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version