在近日举办的2025英特尔技术创新与产业生态大会上,英特尔面向酷睿Ultra 200H "Arrow Lake-H"系列处理器推出了一系列AI能力升级方案,重点展示了其在大模型本地化部署与显存优化领域的突破性进展。
该系列处理器通过系统架构创新,实现了最高128GB统一内存配置,其中120GB可动态分配为显存资源。这一特性使其能够直接运行参数量达1200亿的混合专家模型(MoE),无需依赖云端算力即可完成本地推理任务。以酷睿Ultra 9 285H平台为例,该型号已实现对Qwen 3-30B-A3B、Qwen 3-Next-80B-A3B等主流MoE架构模型,以及GPT OSS-120B/20B等稠密模型的全面兼容。
针对超大规模模型部署需求,英特尔开发了基于雷电接口的双机集群方案。通过物理连接两台搭载酷睿Ultra 200H的设备,可构建起支持2350亿参数模型本地推理的计算环境。这种分布式架构在保持低延迟的同时,将推理成本较云端方案降低了约40%,特别适合对数据隐私要求严苛的金融、医疗等领域。
在硬件协同优化方面,英特尔与存储厂商Phison联合研发的aiDAPTIV+显存扩充技术成为亮点。该方案通过智能算法动态调整显存分配策略,使模型响应速度提升3倍以上,同时将内存占用率降低60%。测试数据显示,在运行800亿参数模型时,该技术可使单设备推理效率达到主流云服务的85%水平,而功耗仅为后者的三分之一。















