在近期举办的百度世界大会上,百度创始人李彦宏向业界宣告,人工智能领域已告别单纯的技术展示阶段,正式进入以实际成效为导向的新纪元。会上,百度推出的文心5.0原生全模态大模型成为焦点,其2.4万亿的参数规模与低于3%的激活率,不仅实现了技术架构的创新,更让中国在全球全模态AI竞争中占据领先地位。
李彦宏在演讲中指出,智能技术本身即是最具潜力的应用领域,而技术更新的速度则是构筑竞争优势的关键。随着文心5.0通过千帆大模型平台向开发者开放,AI技术正从实验室走向产业一线,从代码编写到自动驾驶,从文本生成到多模态理解,AI正逐步成为企业运营中的核心能力。
文心5.0的突破在于其独特的训练方式。与多数模型采用的后期融合策略不同,百度CTO王海峰介绍,该模型从训练初期便将文本、图像、音频、视频等多模态数据深度融合,通过统一自回归架构实现特征层面的协同。结合飞桨深度学习框架的超稀疏混合专家技术,模型在保持高精度的同时,算力成本仅为传统模型的二十分之一。
在性能评估中,文心5.0在四十余项权威基准测试中表现优异,语言与多模态理解能力与国际顶尖模型持平,图像与视频生成能力则达到垂直领域专业水平。会前公布的大模型竞技场排名显示,文心模型在文本任务评测中位列全球第二、中国第一,尤其在创意写作和复杂问题解析方面表现突出。
大会现场,一段关于“老罗数字人”的演示引发关注。首次演示因网络问题失败后,李彦宏返场并调侃:“百度做AI十年,最不怕的就是解决问题。”第二次演示中,数字人不仅准确回答了关于文心5.0优化直播话术的问题,还能根据现场灯光变化调整表情,展现了模型的全模态理解与生成能力。
针对行业对AI泡沫的质疑,李彦宏提出了“倒金字塔”产业理论。他通过对比图指出,传统AI产业中,底层芯片占据大部分价值,而模型层和应用层价值占比低,导致芯片成本高企,中小企业难以承担AI研发,大量应用停留在概念阶段。而“倒金字塔”模式则强调,芯片之上的模型应产生十倍价值,基于模型的应用则应创造百倍价值。
百度的生态布局已践行这一逻辑。底层由昆仑芯P800提供算力支持,中间层以文心5.0为核心模型,上层则衍生出WPS AI、医疗大模型、教育解决方案等垂直应用。自2019年启动文心大模型研发以来,百度已投入超过1800亿元,其中70%用于底层技术与产业落地的衔接。
大会上,百度展示了一系列AI应用内化的成果。全球首个可商用的自我演化超级智能体“伐谋”能够针对复杂问题快速建模,并根据条件变化自动迭代,应用于交通、能源、金融、物流等领域。数字人领域,慧播星“实时互动型数字人”在“双11”期间表现亮眼,83%的开播主播使用过该数字人,开播直播间数同比增长119%,GMV同比提升91%。
百度搜索的AI化改造也取得进展。李彦宏透露,百度搜索大部分结果由AI生成,首条结果的富媒体覆盖率已达70%,用户搜索十个问题,七个答案都是图片、视频、直播甚至数字人等富媒体形式。
在全球化布局方面,百度的AI能力也在加速拓展。自动驾驶平台萝卜快跑已覆盖全球22座城市,并与Uber、Lyft等国际出行平台合作,业务扩展至亚洲、欧洲及中东市场,累计提供超1700万次出行服务。慧播星数字人向全球开放,率先落地巴西市场,后续将发力东南亚、美国等重点国家市场。
百度文库、百度网盘推出的GenFlow智能体升级至3.0,用户数超2000万,成为全球最大通用Agent,其海外版一站式AI学习办公平台Oreate在短期内已获得120万用户。无代码开发工具秒哒升级至2.0,已累计生成40多万个应用,服务了超过千万的用户,其海外版MeDo在全球产品榜Product Hunt上取得榜首的成绩。
李彦宏在大会结束时强调,技术迭代速度是构筑竞争优势的关键。百度将持续投入研发更前沿的模型,推高智能天花板。从芯片到应用,从技术到生态,百度正努力将AI内化为各行各业的原生能力,让智能红利转化为实实在在的社会红利。





