在深圳举办的CFMS|MemoryS峰会上,来自全球存储、CPU/GPU、AI大模型及汽车等核心产业链的企业代表齐聚一堂,围绕“穿越周期,释放价值”的主题,共同探讨AI时代下技术融合与生态协同的创新路径。高通公司AI产品技术中国区负责人万卫星在峰会上发表主题演讲,深入分析了端侧AI在构建个人智能化未来中的关键作用,并分享了高通在跨终端AI生态布局中的实践与成果。
万卫星指出,AI技术正经历从感知到认知的迭代升级。初期以语音识别、图像分类为代表的感知AI已实现大规模商业化应用,例如手机计算摄影便是典型案例;当前行业聚焦的生成式AI通过预训练模型在监督场景下解决问题,而智能体AI则进一步突破,能够在无监督环境中自主理解用户意图并执行复杂任务。他特别提到,物理AI作为新兴方向,正通过模拟真实世界物理规则实现更自然的交互,这一技术在巴塞罗那MWC大会上已展现出初步应用成果。
在生成式AI的端侧部署领域,万卫星透露,终端设备的算力提升正推动模型参数规模快速扩张。目前手机端已支持10亿至100亿参数模型运行,PC端可达130亿至200亿,车载场景更支持200亿至600亿参数模型。针对AR眼镜等低功耗设备,高通通过内存带宽优化和量化位宽技术,成功实现10亿至40亿参数模型的全端侧运行。上下文处理能力方面,端侧模型从三年前的1k-2k token扩展至当前的32k-128k,多模态交互也取得突破,去年9月高通已联合合作伙伴完成50亿参数全模态模型的端侧部署。
端侧AI的普及面临多重挑战。万卫星强调,内存容量与带宽限制直接影响模型规模与响应速度,而高集成度设备如手机对能效的严苛要求,则迫使行业必须在性能、功耗与成本间寻求平衡。为此,高通通过统一技术架构,在骁龙平台中集成高性能、低功耗的AI引擎,为端侧推理提供硬件支撑。例如第五代骁龙8至尊版移动平台和骁龙X2 Elite计算平台,已广泛应用于市场商用终端,实现多场景下的即时AI服务。
智能体AI的发展正重塑人机交互范式。万卫星描述,未来的终端将形成感知-理解-推理-记忆-执行的闭环系统,通过多智能体协同实现任务专业化分工。这种架构不仅能提供低时延、无感的个性化服务,更将突破单一设备限制,构建以用户意图为核心的跨终端生态。他举例称,用户无需通过特定APP操作,只需自然语言交互,智能体即可调动手机、耳机、汽车等设备协同完成任务。
在数据中心领域,高通同步推进混合AI架构落地。今年MWC期间发布的Qualcomm®AI200/AI250加速卡,通过创新内存架构显著提升推理效率,其中AI250机架系统在降低总体拥有成本的同时,为生成式AI提供卓越的内存容量支持。这种“端云协同”策略,使高通AI能力覆盖从消费电子到工业物联网的广泛场景。
万卫星最后强调,高通的AI战略始终围绕“统一技术路线”展开。通过跨产品线的软硬件协同优化,高通将AI能力从单点芯片扩展至平台级解决方案,形成覆盖手机、可穿戴设备、汽车、机器人及数据中心的完整生态。这种布局不仅加速了AI技术的规模化应用,更为行业构建高效、安全的智能化未来提供了可复制的实践范本。









