ITBear旗下自媒体矩阵:

Create2026百度AI开发者大会沈抖主题演讲

   时间:2026-05-15 11:36:09 来源:互联网编辑:汪淼 IP:北京 发表评论无障碍通道

时间:2026年5月13日(周三)上午
地点:国家会议中心二期
沈抖:大家早上好!非常高兴再次跟大家相聚在百度AI开发者大会。刚刚Robin讲到, 进入智能体时代,衡量大模型平台的繁荣程度,应该看DAA,因为它反映了智能体对整个社会的渗透和价值。 百度的底层能力,不仅支撑了大家看到的四个智能体,也在通过百度智能云支撑各行各业的客户打造他们自己的智能底座、开发他们的智能体。
这些智能体,可能只有几个人、甚至是一个人在用,但是解决了业务的实际问题,这正好印证了DAA规模的重要性。 接下来,我们就看几个行业的案例。
中国出海,早已经不只是把产品卖出去。 中国的产品,正在进入全球供应链最核心的环节。背后的底气,就是品质。无论是一件小商品,还是一个零部件,都要经得起全球市场的检验。
义乌,是全球最大的小商品市场。 为了承接大量来自全球市场的订单,义乌逐渐形成了非常独特的 “前店后厂”的模式:前面跑客户、接订单;后面盯生产、管质量。 这样,市场需求就可以快速传导到工厂去生产,生产又可以快速满足市场需求。
但这也意味着,一位老板往往要身兼数职。 大事儿小事儿,都得老板“看着办”。 我们先看个视频。
(播放视频)
视频里展示的,是一家做无人机的工厂。其实在义乌126万家店铺背后, 有大量这样的工厂。它们不是我们想象的那种“超级工厂”,却代表了 中国制造最有活力的一面:灵活、高效、充满韧性。 它们要做到 48小时打样、72小时出货。非常考验生产管理能力。
过去,我们想要AI帮助管好生产,就要针对不同问题分别训练模型, 再把这些识别规则、处置流程,逐个配置到摄像头上。 现在,基于“一见”视觉智能体,能很方便的搭建出一个“AI厂长”。 它预置了安全隐患、设备异常、人员违规等常规技能。
在这个基础上,商家只要用自然语言把自己的产线标准补充进来,就可以学习这家工厂的管理要求,统一调度全厂摄像头,把规则配置到相应点位。 这时候,厂长就有了一个专门管现场的视觉龙虾。 有了这样的智能体,厂一代的经验就可以沉淀下来,让厂二代放心接班。
“前店后厂”,不只有“AI厂长”,现在“AI店长”也上岗了。 接下来,我们通过一个短片,看看这个“AI店长”在义乌是怎么工作的。
(播放视频)
老外到了中国也会讲价了,大家到义乌也可以体验一下这样的数字导购。这样的“AI店长”,其实是基于百度智能云 Hogee 搭建的龙虾版营销智能体。它内置了一系列营销 skills,可以现场做导购;可以看销售数据;还可以结合库存,给出调货、促销建议;也可以发现逾期订单,提前预警。
和“AI厂长”一样,这些”AI店长”的skills也可以不断扩展、成长、进化。 比如接入物流信息后,它就能知道物流成本、交付时效,帮店家做好经营管理。 现在,这套“前店后厂”的能力,已经开放给了我们的客户和伙伴。
刚才大家看到的,就是我们当地的一个伙伴,基于 一见 和 Hogee 两个 智能体,为义乌商家搭建的解决方案。 当然义乌只是一个例子。中国有非常多优秀的产品和品牌,我们希望这些智能体能够帮助更多的中国企业,把好的产品带到全球市场。
同样靠品质赢得市场的,还有汽车。 这几年,中国汽车越来越受欢迎。大家看的不只是性能,还有智能驾驶带来的出行体验。 国民智驾的背后,其实是整个汽车产业链的科技创新。
2019年,中国汽车产业智能化开始加速。 百度凭借全栈AI布局,率先参与其中。 那一年,我们支持吉利打造了他们的第一个专有云;去年,我们又支持地平线建设了他们的超大规模集群,一起加速实现智能辅助驾驶方案的量产。
这个过程中,不断会涌现出新的需求。今天,我们已经支持了包括主机厂、电池、芯片、无人车等产业链领军企业的研发、训练、仿真、测试和量产的各个环节。 去年,我们成功支持了超过两千万辆 L2级辅助驾驶新车的交付。我们跟长安汽车的合作就是一个很典型的例子,长安有164年的历史,这样一家百年企业,他们非常清楚真正的变革,一定是底层能力的重构,所以长安的智能化转型做的不只是车机AI交互入口,更是构建从智能座舱到智能驾驶的核心竞争力。
其实早在3年前,我们就和长安共建智算中心,当时的算力规模达到了每秒142亿亿次,刷新了当时的行业记录。最近,我们又陆续通过百舸平台深度优化智算中心的计算效能,完成自动驾驶模型的高效训练和迭代。
目前,工信部只批准了两家车企的 L3级自动驾驶车型产品, 长安就是其中之一。 今年,长安的端到端自动驾驶技术就会走出实验室,实现量产搭载。
除了主机厂商,我们也在和上下游企业合作,共同推动整个中国汽车产业走向整车智能、产业智能。我们的客户地平线就是其中之一。 今天,非常高兴邀请到了地平线的创始人兼CEO 余凯博士,来给大家分享地平线的智驾布局。

沈抖:非常感谢余凯博士的分享,我们会继续加强合作。同时也非常感谢这么多的中国车企选择了百度智能云。 今年,VLA智驾模型受到业内的普遍关注,它对推理的要求更高、需求更大。 我们已经准备好了汽车推理时代的专属算力底座。接下来,会和更多的客户、伙伴一起,把AI带进汽车产业链上下游的场景,推动中国汽车产业的智能化发展。
其实不仅是汽车,AI也在进入更多的硬件场景。 从智能手机,到AI眼镜,越来越多的终端都在重新定义和满足用户的 需求。 AI终端,正在成为新的超级入口。
我举个例子。 荣耀是我们的老朋友。我们从24年开始就在共同探索"端云一体化"。文心大模型、AI搜索等一系列Agent Infra能力,都在帮助荣耀YOYO不断优化用户体验。
在刚刚过去的四月份,荣耀YOYO用户规模已经超过了1个亿。 它可以生成游玩攻略、讲解景点,做您的专属导游;也可以推荐美食,如果感兴趣某个地方,一键跳转到百度地图就可以导航。
其实不止是荣耀。现在,全球前十的手机厂商,都在使用百度智能云Agent Infra的相关能力。随着OpenClaw通用智能体的渗透和普及,手机厂商开始开放它们操作系统层级的skills,再结合我们说到的Agent Infra这种智能体的搭建能力,可以给客户打造越来越多的手机原生的超级助理。
我们来看一个案例。用户对AI助手说:“五一假期我想带着孩子从广州去成都,4月29日出发,5月3日返回,错峰出行,帮我规划一下行程。”
这时候AI助手会去调度手机内置的日程管理skill,快速梳理用户的既有日程,看看时间上有没有冲突,比如它发现有一个体检,时间冲突了,它会记住这事儿,在后面的规划里提醒用户。
然后,AI助手会调用各个商旅平台skills,筛选合适的航班和酒店,根据用户偏好推荐相应的航班,并标注是不是和体检时间冲突了,会给出酒店,都是符合用户偏好的亲子酒店。
这时候它会让用户确认航班,因为上午有体检,用户选择了下午的航班,然后确认酒店,用户选择了希尔顿。 AI助手开始根据用户的机酒选择,输出最终的行程方案。出完方案之后,还会调用手机里的日程和提醒的Skill,把所有这些安排都加入日历,设置当天出发的闹钟。
可以看到,日历创建好了,去机场的闹钟也创建好了。在这样一个Demo里,可以看到,因为有了龙虾的能力、智能体的能力,现在这些AI完全可以记住你的游戏偏好、重要事项,还能帮你编辑日历、闹钟等,为您设置专属提醒。
这样的故事过去很多年一直在持续,但直到今天,才变成了真正的现实。
这是我们在手机上做的一个案例,除了手机厂商,百度智能云还服务了超过1000家AI硬件公司,为他们提供核心算力、模型、智能体搭建等服务,帮助这些硬件公司把 AI做到他们的产品里、提高产品体验,让这些传统的硬件也能长出超级智能体。
跟AI硬件相关的一个行业,是具身智能。 这是一个充满活力的新兴产业,而且它的进化速度非常快:模型在进化,本体在进化,应用场景也在进化。
百度智能云从最开始就跟具身智能行业走在一起, 屏幕上的这些画面,都已经成为了国民记忆。 曾经被认为是小众研究方向的具身机器人,也已经走出实验室,成为了一个万亿级别的赛道。
但具身要落地,“数据、模型、本体”三座大山必须跨越。 本体,毫无疑问是制造业的重任;数据和模型,是AI基础设施要解决的问题。
先看数据方面, 具身智能面临的数据问题跟当年智能驾驶非常相似,但但稀缺问题更突出。 我们把百度过去十年在自动驾驶上积累的经验迁移到具身领域,支持大规模的数据采集和标注。
再看模型方面,具身机器人要处理视觉、语言、动作等更复杂的场景,所以具身模型的训练就不是简单的租几张卡的问题,得益于我们在AI Infra上的常年积累,我们把VLA这种典型模型的训练速度提高了70%,在世界模型推理上的时延降低了50%。原本按周计的训练,现在可以按小时来训练。
在此基础上,我们还提供了算力、平台工具链、数据服务、语音交互、 安全等全栈能力,很快也会推出可以规模化部署的“训练-评测-反馈”的闭环系统,帮助企业构建 Physical AI 时代的 Scaling 能力,让模型可以大规模、体系化的训练和迭代。
其实我们已经帮助几十家具身企业在做模型迭代、场景落地。 其中,星海图是近两年增长非常快的企业之一。 接下来,有请星海图CEO 高继扬高总,来分享一下星海图的故事。

沈抖:感谢继扬的分享,也非常感谢星海图的信任! 其实除了星海图,我们还服务了包括北京、上海创新中心在内的具身智能“国家队”,也在为智元、智平方这些产业链上优秀的具身企业提供全栈AI支撑。
我们非常荣幸,能够在具身行业这样一个大发展时代跟这些优秀的领导者同行,与大家一起,把具身智能从实验室、展厅,推向千行百业,推进千家万户。
任何产业的发展,都离不开金融的支持。 作为“国民经济的血脉”,金融行业始终把安全、稳定放在最前面。 而今天,这个需求进一步升级:从底层算力、模型平台,到上层应用场景,全栈AI都要实现全部自主可控。
招商银行一直是中国金融界科技创新的标杆。 去年,我们就开始帮助招行规模化部署昆仑芯P800。从算力适配、 模型迁移,到应用落地,一步步把国产算力用到了金融业务的主流程。
现在,招商银行已经上线了800多个AI应用,覆盖了风控、营销、 研发、办公等核心业务场景。 而这其中,50%以上的场景都在P800上。
浦发银行,作为国内头部银行,它们有非常强大的精细化运营和风险管控能力,而它们正在借助AI,把这个能力做的越来越强。 我们看一个短片。
(播放视频)
在金融行业,稳定是底线,创新是方向。 今天,我们非常荣幸,和100% 的系统重要性银行,以及 800多家金融机构,把AI创新性地应用到业务系统里,来服务实体经济,助力产业升级。
是央企。央企面对的是国家发展和产业升级中最前沿、最复杂的需求。它们在变化中进化,持续推动行业前进。 和央企合作,最重要的是长期同行,找到新需求、提供新方案。 我们和国家电网的合作,已经十年了。
2016年,中国刚实现户户通电。那年是我们和国网的第一次合作,通过智能客服,大幅提升了客服的接通率和体验。到了2024年,我们基于昆仑芯、文心大模型与国网共同打造了千亿级光明电力大模型正式上线,让AI进一步走进了电网的心脏。
去年,国网在40多个场景中落地了智能体。比如,在巡检领域,我们和国网共同合作,提出了小模型和大模型结合的方式,能够使得识别准确率从百分之五六十提高到85%以上,整个巡检时间也从2.5小时压缩到了45分钟。这套方案已经覆盖了全国几百座变电站,守护着11亿人的用电安全。
去年年底,中国全社会用电量突破了10万亿千瓦时,成为全球第一个迈过这一门槛的国家。我们非常荣幸和国网一起,参与、见证了中国从能源大国走向能源强国的伟大进程。
今天,包括国家电网在内的所有央企中,80%以上的央企都用上了百度智能云。我们共同在上百个场景里落地了智能体,推动工业制造、智慧能源、钢铁冶金、交通物流、以及医药健康等行业持续创新。
前面给大家汇报了百度智能云在几个行业里的落地案例, 这只是我们服务的所有行业和客户中一个很小的缩影。
这些行业、这些客户,流程不同、数据不同、系统也不同, 但有一点是相同的:他们都希望用技术创新来真正赋能业务、创造价值。 一直以来,百度“芯云模体”全栈 AI,就是希望用这套灵活的能力,来解决客户真实的业务问题。
过去十年,为了满足客户需求,我们不断打磨产品和技术; 而更强的产品技术,又让我们进入更多行业和客户,形成了一个持续进化的正循环。
也正是在这些真实场景里,我们越来越清楚地看到,客户要的东西变了。 过去,客户需要的是业务的弹性、可靠、降本增效,所以这时候这些云服务提供的是计算、网络、存储这样的资源。
而今天,客户需要的是高活跃、高价值、规模化的智能体应用来直接解决他们的实际问题,所以云服务也必须重新定义,成为一套能够支撑智能体大规模运行、持续进化、安全可控的全栈AI基础设施。
10年前,百度智能云就把重心放在了“智能”两个字上。接下来,我们还会继续引领智能潮流、拓展智能边界,把百度智能云升级成为面向大规模智能体应用的新全栈AI云!
具体来讲,这套全栈能力,包括AI Infra和 Agent Infra两大部分。 在 Agent Infra 上,我们要把单位Token的智能水平做到最好, 让智能体更好地完成任务。
在 AI Infra 上,我们就是要为您提供每瓦性能更强、性价比更高的 AI 算力,让每一次训练和推理,都能转化成更好的智能体效果。 今天,我们将全新升级 Agent Infra!
我们知道模型和周边系统同样重要。 因为模型决定了智能体能力上限,而周边系统决定了智能体能力的下限。 今年,这个周边系统又有了新名字,叫Harness Engineering,我们叫它“驾驭工程”。
做一个智能体,无非两件事:一个是选合适的模型,一个是做高效的驾驭工程。 这也是agent infra升级的两个重要方向。
我们将“MaaS模型服务”升级为“Token Factory — 词元工厂”!因为智能体要处理的上下文,是 Chatbot的1000倍,而且还会随着任务轮次增加而增加。现在智能体要完成一个任务,动辄需要上百万tokens,所以模型的速度和成本都是一个问题。
我们基于 Agent-First 的理念重构了产品,尽量减少token的重复计算,使得推理速度能比市场提高25%。 而今天,您在百度上调用百度文心模型、DeepSeek、GLM、MiniMax 这些国产模型,用的底层算力就是国产昆仑芯。
这就意味着,中国企业在做智能体,不仅可以用上国产模型,也可以获得国产芯片的高性价比服务。
Agent Infra第二个升级,是“Harness Engineering - 驾驭工程”!
在应用场景里,“驾驭工程”做的好不好,有一个最关键的评价标准:就是能不能用更少的对话轮次、更少的tokens,完成更多更复杂的任务。我们不仅提供长上下文管理、持久记忆、工具调用、子智能体调度、 评估反馈 和Runtime 这些能力,更关键的是我们把这些能力做了深度协同优化。
现在用我们的“驾驭工程”,如DuMate产品演示的一样,在用浏览器、Office等工具来解决的办公场景的任务上,成功率达到95%,并且得益于我们做的长下文管理的优化,同样的任务,对话轮次会少,相比OpenClaw,可以节省23%以上的tokens。
刚才演示过的几个智能体,以及各个客户搭建的智能体,都是在Agent Infra这套基础设施上开发出来的。
我们的目的不是为了开发一个一个的孤立智能体,是想建设一套能让这些智能体协同优化的基础设施。一方面,搭建出来的智能体,又会变成skills,通过驾驭工程,为更强的智能体提供服务。另一方面,这些智能体在运行过程中保留的数据和轨迹,又回流到Token Factory里,帮助我们优化模型。
所以,你有好的模型、好的Harness,就能做出好的智能体;你有好的智能体,就会有更多的反馈,沉淀出skills,沉淀出数据和轨迹, 提高你的模型个Harness能力,这样一个飞轮,就可以推进整个系统的持续迭代,正向优化。
未来的企业,不会再问“你今天用了哪个模型”,它会问你“你的智能体今天到底完成了多少任务”。所以,AI云的下半场,不是比谁消耗了更多的token,而是谁能把每一个Token用的更好。百度智能云要做的, 就是让我们的企业“多、快、好、省”的把每一个token都转化为企业的生产力。
智能体越多、任务越复杂,对底层算力的要求就越高。 今天,我们也全面升级了AI Infra,我们会从模型训推、集群和数据中心几个方向做大的突破,来为您提供性能更强、更高性价比的AI算力服务。
第一个升级,是面向智能体的训推优化。 在调用大模型上,智能体和chatbot相比,一个最大的特点就是超长且重复的前缀, 所以,这时候我们要尽可能命中KV Cache、复用上下文,这也成了面向智能体做推理的关键能力。
我们通过显存、内存到SSD的分级池化,把整个KV Cache命中率做到90%,达到业界最高水平。我们还通过AFD分离、 PD分离、缓存调度等一系列优化方案,实现了Prefill节点、Decode节点、Cache系统等的异构调度,使得长链路的Agent推理相比主流开源社区引擎效率提升了三倍。
这个智能体应用对大模型又提出了新的要求,也带来了新的机会。我们也提供了业界领先的多模态的训练框架,支持图像、视频、代码等不同数据类型的混合训练。整个训练效率相比社区提高了一倍以上。我们还可以在100毫秒内调取大量沙盒,提升强化学习的采样效率。
二者结合,我们就可以将Agentic模型强化学习效率提升一倍以上,让您的智能体可以更快的进化。
下面,说一下支撑这些训推底下的算力硬件。今天中国的芯片市场已经变了,国产算力过去是候补方案,今天成了必选项。
昆仑芯规模化的快速普及就是一个最好的证明。 之前给大家汇报过2024年底搭建的昆仑新3万卡集群,2025年到现在,我们又持续交付了多个万卡级别的P800集群。而且更重要的是,我们在昆仑芯全国产集群上,成功完成了文心5.1一款重要模型的训练。整个训练过程中,Loss曲线平稳下降,稳定收敛;整个集群的有效训练率达到 97%以上;而且万卡规模集群 线性扩展度超过了85%。
这说明,昆仑芯全国产集群,已经可以满足前沿大模型大规模训练 对计算精度、算子稳定性、框架适配、长周期运行等等的硬性要求。
去年11月还给大家汇报过天池256超节点,也在上个月如期点亮,并且在下个月正式上市!相比上一代,它的吞吐性能提高了25%! 我们也完成了包括文心、DeepSeek、GLM、Minimax等主流模型的适配。结合推理性能优化,这些模型的推理效率提升了50%以上!
在超大规模集群里,网络不是用来连接算力的,网络本身就是算力。我们将集群接入速率从单接口400G接入升级为双口400G冗余接入,而且结合多平面架构,可以让网络具备更强的故障容错能力; 同时依托全二层组网方案,端到端延时优化了50%。 升级后的高性能网络HPN5.0架构,可以支持搭建数十万卡到百万卡的超大集群。
要做超大集群,我们必须重新定义数据中心。特别是进入吉瓦时代, 对云厂商来讲,基建水平就决定了算力水平,因为一吉瓦相当于 一座特大城市的居民用电规模,这对数据中心的建设提出了极高的要求。 所以我们的第三个升级,就是吉瓦级AIDC!
传统数据中心的架构,是以供配电为核心。而今天的AIDC,则要以网络为核心。我们最先提出了"网络向心布局"的设计理念: 以网络节点为中心,计算节点环绕部署、供配电系统外置布局。让计算与网络距离最短,最大限度的提升计算效率。
另外风冷液冷也是一个纠结,今天已经规模化的落地了“风液冷兼容架构”,这时候可以实现前端同源,末端按需微调来适配风冷或液冷。
我们在选址和土建阶段就提前规划好了建筑和电力资源, 确保AIDC设计方案平稳落地。 正是因为依赖这些大家所不熟悉的AIDC技术和极致的工程能力,我们可以将一个数据中心的搭建周期缩短30%,实现算力的更快部署。
AI Infra的终局,不是堆更多卡,而是让每一度电、每一张卡、 每一次计算,都能产生更大的价值。全新升级后的AI infra,就是从推理、训练,到芯片、集群、数据中心,为您提供了一整套端到端优化好的基础设施,支持您更好的把算力变成生产力!
Agent Infra和AI Infra两个infra的升级,就构成了今天百度智能云“芯云模体”的新全栈AI云。 中国有最完整的产业体系,最丰富的应用场景和最勤奋的劳动者。这些真实的产业需求加速了智能体生态的发展,而强大的智能体生态,又会使我们的产业体系更加强大!
这是AI赋予时代的绝佳机遇。技术正在让复杂的世界变的更简单。 当机器可以生产一切的时候,人类要做的只有两件事:提出问题、定义标准。 我相信,人类的好奇心,会让我们不断提出新的问题; 而人类的同理心,会让技术更好的服务每一个人。
这是一个由人和AI共同创造、共同进化的时代。而所有的创造和进化,最终都会把我们带向一个更美好的未来。
百度智能云,作为新时代的基础设施,就是要赋能每一个行业、 每一家企业以及在座的每一位,让这一切成为可能。 谢谢大家!

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version