ITBear旗下自媒体矩阵:

量子位MEET2026:高通万卫星剖析终端侧AI演进与混合AI新路径

   时间:2025-12-11 13:50:58 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

量子位MEET2026智能未来大会近日在北京拉开帷幕,本次大会以“共生无界 智启未来”为核心主题,搭建了一个跨行业、高密度的交流平台。来自科技、产业及学术领域的近三十位领军人物齐聚一堂,围绕人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿话题展开深度对话,分享前瞻观点。

高通公司AI产品技术中国区负责人万卫星在大会上发表了以“混合AI:从云端到边缘智能”为主题的演讲。他指出,AI技术正经历从生成式AI向智能体AI的演进,生态系统也从单体模型向复合模型转变,这将成为迈向智能体AI的重要基础。万卫星特别提到,未来的AI体验将朝着混合AI方向发展,高通已通过量化压缩、并行解码、NPU及异构计算架构等技术,推动端侧AI向更主动、更高效的服务形态升级,构建端云协同体系,为用户提供更个性化的智能服务。

万卫星详细阐述了AI应用的演进路径。第一阶段为“感知AI”,涵盖自然语言处理、语音降噪、图片识别等传统技术,这些技术已实现商业化落地。第二阶段是“生成式AI”,依托大规模数据预训练,在人类监督下完成文生图、聊天机器人等任务。第三阶段为“智能体AI”,其特点是能够在几乎无人类干预的情况下自主行动、预测意图并编排任务。第四阶段是“物理AI”,AI将理解真实物理世界并做出反馈,目前尚处于研究初期。

在终端侧生成式AI的发展趋势中,模型尺寸持续扩大。手机已支持近100亿参数的大模型部署,PC可支持约200亿参数,车载场景则支持200亿至600亿参数的模型。模型质量也不断提升,支持思维链和推理能力的模型已实现端侧部署,上下文处理能力从两年前的1K-2K增长至今年的8K-16K,甚至在特定场景下可支持128K文本的端侧部署。终端侧AI正从单一文字模态向文本、图片、视频、音频、语音等多模态演进。

端侧运行AI具有显著优势,如个性化服务、隐私保护、无需网络连接且成本低廉。然而,也面临内存和带宽限制等挑战。内存限制制约了模型参数量,进而影响模型能力上限;带宽限制则影响推理速度和用户体验。高集成度终端运行大语言模型对能效控制提出极高要求,功耗过高可能触发设备温控机制。

为应对这些挑战,高通在技术储备和预研方面取得多项突破。通过量化压缩技术,将模型精度从8 bit、4 bit提升至2 bit,显著减少内存占用;采用并行解码技术,在端侧运行较小草稿模型一次性推理多个token,再由原始大模型校验,提高解码速度;利用先进的NPU和异构计算系统,推动端侧AI从被动式服务向主动式、个性化服务转变。

以智能体AI的具体用例为例,用户可通过自然语言与智能体交互发布微博。智能体理解用户意图后,打开微博APP,搜索照片并添加滤镜,最终完成发布。用户还可监测回复并点赞或回复评论。这一用例在今年9月的骁龙峰会上展示,全程在端侧运行。

高通的产品覆盖智能眼镜、PC、汽车、智能手表、IoT等丰富品类,支持所有骁龙设备间的智能互联。算力较小的设备如智能眼镜、智能手表,可通过Wi-Fi或蓝牙与手机、汽车连接,共享本地数据,将大模型推理任务转移至算力更大的设备,实现分布式个性化推理。

高通公司认为,AI体验未来将向混合AI方向发展。终端侧运行垂类高效模型,提供更安全、个性化的AI服务;云端运行更大尺寸模型,提供更通用、更强大的AI服务。高通将凭借低时延、高速且安全的连接技术,确保混合AI场景下的端云协同与连接。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version