未来几年,你的手机可能会同时被两个人用。一个是你,点开应用、刷消息、回邮件;另一个是你的 AI 智能体,在后台帮你盯日程、调工具、跑任务,有时还会替你操作同一台设备。
过去两年,大多数人对 AI 的想象还停留在一个聊天框里,打开网页,敲下问题,等它回答。智能体把这件事掉了个头,它不等你每次开口,自己就持续待命,拆任务、调工具、跑流程,办完再回来找你确认。
AI 从“你去用它”走到“它替你做”,最先被改写的可能就是计算本身,它在哪里运行、在哪里感知、在哪里做决定,又在哪里产生成本。这正是高通 CEO 安蒙在 6 月 1 日 Computex 2026 开幕主题演讲上想回答的问题。他给的答案,是一条从耳机一直铺到数据中心的“计算连续体”,让计算分散到各处去发生。
1
AI 开始在你身边常驻
要看懂这个连续体,得先弄清它要承载的是一种什么样的 AI。
最近越来越多的人已经在提前体验这件事。他们在家里放一台从不关机的小电脑,整天跑着 OpenClaw 这类智能体,人在外面,用一个聊天框给它发指令,让它查资料、写代码、把杂活办完。安蒙在台上也提到了这个现象。这还是偏极客的玩法,但它把一个普通人迟早会遇到的问题提前摆了出来,智能体要自己干活,就得有一个全天候待命的地方。
过去的软件是你去用它,打开应用、敲下指令、等它回话,所有动作由人发起。智能体把这套逻辑改了。它全天候在线,持续记着上下文,能自己把一个目标拆成多步、在不同的系统和数据之间调度,在你没盯着的时候把活干完,干完再回来跟你确认。
这就带出一个容易被忽略的变化,同一台设备会开始扮演两个角色。一个是你在操作它,这是今天所有设备的设计前提,另一个是智能体在自主操作它,这会是明天的常态。两件事压在同一台手机上同时发生,对硬件是实打实的新负担。光是你自己用,续航撑一天都吃力,再叠上一个全天候跑的智能体,功耗和时延立刻成了绕不开的工程题。
而今天大多数设备,并不是为这种 AI 从头设计的。硬件和系统都围绕“用户主动操作”搭起来,跟一个会自己动手的智能体并不对路。高通把这个转变概括为,数字生活的中心正从手机挪到智能体身上。手机的角色也跟着变,它过去是所有数字体验的唯一中心,如今降成智能体网络里的一个节点,各类设备则围绕智能体运转,成为它触达用户和现实世界的端点。
也因此,一批更适合智能体的新设备正在长出来,比如贴着你眼睛、耳朵和嘴的智能眼镜。把这些都算上,端点的规模相当可观,全球几十亿部手机、二十亿台从可穿戴演进而来的个人 AI 终端、二十亿台 PC,再加上数亿辆智能网联汽车。这场硬件层面的改造,不是小修小补能应付的。
1
常驻的智能体,住不进单一的云
接下来的问题顺理成章,这么一个常驻、高频、还要跨服务跑的智能体,能不能干脆全塞进云端。云当然能扛,只是把什么都堆上去,在成本、时延、隐私和情境上都不见得最优。
先看成本。高通把 AI 的演进拆成三段来算这笔账。最早的对话式 AI 是单轮问答,一次交互大约消耗一万个 token,到了能多轮推理的阶段,单个任务涨到十万,再到能自主调用工具、连续执行多步的智能体,单任务冲上百万量级。短短两代,单任务的token消耗放大了约一百倍。再乘上全球设备全天候地跑,总量到 2030 年大到离谱,高通的说法是那时每十秒产生的 token 就要按万亿计,安蒙在台上甚至调侃,这个数大得他都不知道该怎么念。
成本怎么省,高通用一个贴近开发者的例子摆了出来。跑一个真实的 Claude Code 编程任务,让规划器把一部分留在设备本地算、必要的部分才送上云,在结果一样的前提下,省下约一百四十万个 token,成本降了六成。也有分析机构测算过,纯云端模式在十亿级用户规模上持续服务,成本和可扩展性都会触到天花板。账还不只在钱上,实时性、隐私,加上智能体必须读懂的当下情境,你在哪、周围有什么、传感器读到了什么,这些都更适合在离你最近的地方处理。
成本只是一半的故事。端侧能接住这件事,其实是这两年才成立的。放到 2023 年,端侧模型的能力、NPU 的软件栈、加上应用生态都还不成熟,把智能体放到设备上更多是设想。到 2026 年,小模型、多模态感知、本地推理和跨设备的智能体框架几条线同时往前走,端侧才从一个省钱的备选,变成一个真能改善体验的选项。也是在这个节点,计算发生的位置开始松动重排,而这恰恰是高通的机会。
1
为什么是高通
这套连续体不是谁都能讲。过去十几年,高通是全球智能手机芯片和基带的核心供应商,你用过的不少安卓旗舰,连接和算力的底层都来自它。只是 AI 时代的聚光灯大多打在英伟达和云端算力上,高通的名字没那么响。
高通几十年只做一件事,在被电池、体积、散热、连接和实时性死死卡住的设备里,把算力一点点抠出来。这套手艺过去属于移动时代,如今智能体要常驻到这些设备上,它忽然变得稀缺。端侧也跟着换了身份,过去它的卖点是省电和便携,现在它是智能体感知现场、触发行动、就地完成闭环的第一层。
这也是高通最爱讲“每瓦性能”的原因。移动行业几十年其实一直在解同一道题,算力需求涨得比可用能源快。这道题过去出在手机电池上,如今原封不动搬进了数据中心的电力和散热账本,而高通几十年来一直在解这道题,它这条计算带的跨度也大得惊人,一端是功耗两毫瓦的耳机,另一端是2000千瓦的数据中心机柜。
把低功耗计算、连接、庞大的终端出货和跨品类生态重新组织一遍,就是高通这次主推的连续体。它想让外界看到的,是自己正从卖一块低功耗芯片,走向提供一整套跨层级的计算系统。
高通这次摆出来的产品,能看出这套打法的轮廓。PC 这端,骁龙 X2 Elite 第一次进了桌面,华硕基于它做了 mini PC“Ascent QN10”,更入门的骁龙 C 平台把带基础 AI 能力的 Arm PC 下探到三百美元级,宏碁、惠普、联想都跟了进来。机器人这端,高通发布了 Dragonwing(跃龙)IQ10 机器人参考设计,把最高 700 TOPS 的端侧 AI 算力、18 个 Qualcomm Oryon CPU 核心、多核 NPU 和 GPU、专门的安全岛,连同本地大模型推理和整套开发工具链打包在一起。它交付的不只是一颗芯片,还有一套拿来就能开发、面向量产的系统,这正是机器人这种重续航、重集成的品类最缺的东西。
往物理世界看,逻辑还是同一套。汽车被拆成两层智能,座舱里以人为中心的个性化交互,和靠摄像头、雷达、地图做感知决策的驾驶 AI,两层当成一个系统协同,高通把这个趋势叫作走向 AI 定义的汽车。机器人则按即时反应、动作执行、逻辑推理分层处理算力。再往外,工业和城市场景也在被改写,一颗 AI 摄像头既能盯安全合规,也能数清路口的车流,看到了还能自己触发下一步。设备千差万别,算力的配比各不相同,底下却是同一条连续的能力带。
高通还想把这条带子延伸到网络本身。它此前在 MWC 上把 6G 定义为第一个为 AI 时代设计的无线技术,除了连接,还多了分布式计算和感知两根支柱。感知这条尤其有想象空间,它让无线网络不只是传输数据,也能成为物理 AI 获取环境信息的一环,给跑在各处的智能体补上现场情境。
软件生态也已经先动了。主流的开源和闭源模型都能在骁龙平台上跑,OpenClaw、Hermes 这类智能体规划器、能本地运行的 Claude Desktop,以及高通合作伙伴 Humain 正在开发的智能体操作系统,都把骁龙当成了落脚点。把端侧当成智能体的家,已经不是高通一家的判断。
高通发布Dragonfly产品
1
高通的“计算连续体”
把镜头拉远,高通这一连串动作,落点其实在它自己身上。
这条连续体的最远端是数据中心,也是高通这次最受关注的一笔。它发布了数据中心新品牌 Dragonfly(飞龙),说已经在和超大规模云厂商合作推进部署,但这一次没有公布具体规格和完整路线图,更多信息要等到 6 月 24 日的投资者日。外界真正关心的,是它会怎么把 Oryon CPU、AI 推理和能效优势,组织成一套云厂商愿意接受的数据中心方案。
高通并不是数据中心的新人。2017 年它的 Centriq 试过服务器芯片,没能在当时还不成熟的 ARM 服务器生态里站住,2021 年它花约十四亿美元收购 Nuvia 重新备料,这支团队的核心成员当年就是打造苹果高性能 CPU 的人,后来骁龙 X 系列在 PC 上的表现,靠的正是他们的底子。端侧是它已经验证过的那一端,数据中心是它还想补上的另一端。
这场 Computex 还有另一条主线。云厂商和 GPU 阵营正从数据中心往边缘走,高通则从端侧往数据中心补,两条路线相向而行,交汇点都落在智能体上。谁走得更顺,要看接下来几年生态怎么长,但双方有一点判断一致,智能体会带来一轮覆盖几乎所有设备的硬件升级,规模可能是这个行业很多年里最大的一次。
所以高通想改写的,与其说是某一类设备,更是它自己在 AI 产业链里的坐标。它过去卖的是终端里的那块计算能力,现在要让行业相信,智能体时代真正需要的,是一条能把耳机、手机、PC、汽车、机器人和数据中心串起来的计算带。
对国内从业者来说,值得盯的也正是这件事。计算的位置一旦开始重新分配,设备怎么设计、芯片怎么排布、云和端的账怎么算,都会跟着重写一遍。








