在人工智能领域,大模型的热潮尚未退去,另一条更贴近现实应用的技术路径——端侧AI,正以惊人的速度崛起。端侧AI的核心在于将算法和模型直接部署在终端设备上,如机器人、智能汽车、消费电子产品和智能制造系统,使这些设备能够在本地完成数据采集、分析、推理和决策,无需持续依赖云端服务器进行数据传输。
以具身机器人为例,若其动作决策完全依赖云端计算,网络波动可能导致抓取、避障或交互动作出现延迟,进而影响操作的安全性和自然性。而搭载端侧AI的机器人,则能在本地毫秒级完成手势识别、物体抓取或行人避让等任务,不仅降低了功耗,还确保了交互过程中敏感视频或传感数据不会外泄,从而提升了隐私保护和安全性。
从云端到端侧,这一转变不仅仅是算力位置的迁移,更是对整体技术架构的深刻变革。传统设备长期遵循“先采集、后传输、再计算”的串行逻辑,传感器与处理器各自为政,数据搬运过程中消耗了大量时间和能量。而端侧AI则要求实现“感算一体”,即让感知与计算在物理层面深度融合,达到“感知即计算”的境界。
上海交通大学人工智能学院副教授程远的研究方向,正是这一领域的典型代表。他的学术生涯横跨清华大学的前沿交叉研究和上海交通大学的系统研究,并积累了横跨学术界与产业界的丰富经验。他始终聚焦于一个问题:如何让智能真正“落地”?在接受采访时,程远几乎总是从“系统性工程”的角度来解答每一个问题。他认为,AI的规模化落地并非依赖于算法的单点突破,而是需要算力底座、物理器件与软硬件协同设计的同步演进。
程远的这种思路,也体现在他的创业实践中。2019年,还在上海交通大学读博的程远作为创始人成立了辛米尔科技,并担任首席科学家。作为一家专注于端侧AI的公司,辛米尔致力于打破传统冯·诺依曼架构的边界,将感知、计算与行动深度融合。他们认为,AI的下半场需要的不是更大的模型,而是更高效、更实时、能够嵌入物理设备的硬件原生智能系统。
这种硬件原生的端侧能力,也是Agentic AI从“对话”走向“行动”的关键。当设备具备本地实时感知与自主决策能力时,AI便能摆脱对云端调度的绝对依赖,在真实场景中形成感知-规划-执行的闭环,真正具备与环境持续交互的主体性。
在对话中,程远详细阐述了Agentic AI热潮的本质区别。他认为,这波热潮最核心的变化是AI从“只会说”真正走向“会去做”。与前一波大模型热潮聚焦于内容生成和问题回答不同,Agentic AI进入了任务闭环,需要感知环境、做出判断、调用工具,并最终落实到具体的行动和动作上。评判标准也从模型是否聪明转变为能否稳定、低延时、鲁棒可靠地完成任务。
当谈到端侧Agent与云端Agent的关系时,程远表示,云端和端侧并非替代关系,而是分工关系。云端更像大脑,适合做复杂规划、长链条逻辑推理和知识调用;端侧则更像反射神经,负责本地高频、实时性的闭环响应。他强调,未来真正成熟的Agent一定是云端与端侧协同的系统,尤其在具身智能、先进制造和消费终端等场景中,时延、功耗、带宽、隐私和成本都是绕不过去的约束。
为了实现云端和端侧的更好协同,程远重点研究了“感算一体”技术。他解释说,感算一体就是将计算融合到感知侧,在数据产生和收集的地方就完成计算,从而避免了大量无效的数据搬运和通讯开销。这种技术特别适合需要观察周边环境并马上做出反应的系统,如机器人、智能制造设备和消费电子终端。
然而,端侧AI客户面临着“效率三角”的挑战:既要毫秒级实时响应、又要极低功耗和部署成本、还要处理视频流和时序信号这样的多模态数据。程远指出,感算一体的关键在于缩短计算链路、舍弃无效数据处理和通讯,从而在源头完成计算、决策与行动。这样一来,实时性、功耗和成本就不再完全对冲。
尽管感算一体的原理早已为人所知,但过去十几年一直难以大规模产业化。程远认为,这主要是因为工程化难题的存在。感算一体要求算法、芯片、传感、系统以及场景都一起打通,才能真正落地实现。他强调,他们团队一直将这个问题当作系统能力来做,而不是单点技术,通过算力-算法协同设计方法和从真实场景反推技术路线,最终实现了系统级别的标准应用。
随着视觉端侧AI从简单的“判别式任务”向“生成式/世界模型任务”演进,感算一体架构也面临着新的挑战。程远表示,感算一体架构并非为简单专用的“特种芯片”设计,而是为更复杂的端侧Agent提供通用算力基础设施。它能让计算更靠近数据产生的位置,在感知的瞬间就完成一部分结构化理解,从而减少数据搬运和无效计算的价值。
在具身智能领域,程远也深入探讨了端云之间的语义断层问题。他认为,“脑手不一”是具身智能现在面临的一大问题,云端大模型可能理解了行动意图,但端侧系统在执行时却面临传感器噪声、控制延迟和安全边界的不确定性。他提出,未来的系统应该是一个多Agent协同体系,云端有规划Agent,端侧有数据Agent、安全Agent、效能Agent等,它们之间需要新的任务表达、状态反馈和约束通信机制。
为了解决算力问题,程远的研究还涉及了光计算这一更前沿的方向。他解释说,光计算与传统电子计算的本质区别在于它们依赖的载体和物理机制不同。光计算利用光的传播、干涉、衍射等过程来完成高并行计算,能效上能提升3-6个数量级,计算速度上同样有3个数量级以上的增益。他认为,光计算的目标不是替代一切,而是提供一种新的高能效计算引擎。
尽管光计算在能效比上有显著优势,但光电转换过程中的功耗损失和精度衰减一直是业界的痛点。程远表示,现阶段最务实的路线是先用光计算加速器切入AI里最密集、最耗能的部分,如矩阵乘法、张量计算和并行推理。长期来看,光计算有望重构整个计算链路,用几个数量级的能耗优势解决算力需求爆发和能源消耗之间的根本矛盾。
在谈到学术与产业的平衡时,程远表示这两个角色其实没有冲突关系,而是互相校正。学术让他思考第一性问题,去看五年、十年之后可能成立的新范式;产业则让他回到现实,去回答今天能不能做、能不能落地、谁会真正买单的问题。他认为,将前沿研究真正压到产业可用,再把产业里最真实的问题提炼回学术,这个闭环对他来说是最重要的。
在程远的设想中,未来的万物智能将不是到处都是会聊天的机器,而是各种设备都开始具备即时感知、即时判断、即时行动的能力。智能将像水电一样慢慢变成基础能力,融在设备、系统和环境里。具身机器人将自己做本地感知和行动决策;制造设备将边运行边感知异常、边优化过程;手持设备、智能车、智能家居等也将逐步具备更自然、更低延迟、更低功耗的本地智能交互能力。











