一场聚焦大模型时代推理服务创新发展的专题研讨会在中关村论坛期间成功举行。本次活动由趋境科技与九源智能计算系统生态联合体联合主办,汇聚了院士、顶尖学者及产业领军人物,共同探讨如何构建高效、稳定、安全且普惠的大模型推理服务体系。
活动现场,启元实验室副主任刘航与工业和信息化部电子工业标准化研究院副院长郭楠分别致辞。中国工程院院士郑纬民作为九源智能计算系统生态联合体理事长,发表了题为《从模型服务到Token服务》的主旨演讲。他指出,随着智能体、AI编程等应用的爆发式增长,2026年已成为"Token爆发元年",产业核心正从模型参数规模转向Token产能的稳定、低成本与高质量交付。郑院士强调,未来智能基础设施需围绕"Token即服务"重构,通过全系统异构协同、存算协同及面向服务等级协议的智能调度三大核心技术底座,实现全链路系统级创新。
趋境科技在会上正式发布新一代AI推理平台——趋境ATaaS高效能AI Token生产服务平台。该平台由趋境科技创始人兼CEO艾智远与郑纬民院士等产业界代表共同揭幕。针对硬件资源闲置、软件适配滞后等四大行业难题,ATaaS平台通过四大自研核心技术实现突破:全球首创的异构推理2.0技术"六合",可降低万卡级集群运营成本超20%;超体量KV Cache缓存技术"月饼",将缓存命中率提升至90%,减少90%GPU算力开销;算子级SLO仿真技术"双仪",实现算力资源智能预规划;极致弹性技术"万象",支持万亿参数模型7秒快速拉起。该平台日均Token产能达万亿级别,标志着AI基础设施从"数据中心"向"Token工厂"的演进。
产业生态协同成为本次论坛的另一焦点。并行科技董事长陈健透露,其MaaS服务在趋境科技支持下,将特定场景集群性能提升50%,为多家头部大模型企业提供服务。九源智能计算系统生态联合体副秘书长王豪杰介绍,联合体已推出全国产化GPU适配方案、九齿领域编程语言等成果,推动国产算力从"可用"向"好用"跨越。京东云、华为、阿里云等企业代表分别展示了与趋境科技在推理引擎优化、昇腾AI集群性能提升等领域的合作成果。商汤科技大装置首席架构师项铁尧表示,其与趋境科技在Mooncake开源项目上的合作,显著提升了算力底座的推理效率。
在圆桌讨论环节,清华大学副教授章明星与中国移动、天数智芯等机构代表,围绕国产推理基础设施发展路径展开深入探讨。与会专家形成三大共识:软硬深度协同是释放国产算力潜能的关键,需通过系统级优化弥合硬件性能与业务需求差距;生态统一与标准建设对打破适配难题、实现规模化应用至关重要;人才培养需通过开源社区、技术竞赛等方式,培育兼具理论与工程能力的复合型人才。
论坛同期宣布启动2026年春季启元人工智能大赛,旨在通过赛教融合模式,为国产智能计算生态培育新一代技术人才,持续推动AI产业开源创新与规模化应用。此次研讨会的举办,恰逢AI产业从模型竞争转向规模化应用的关键转折点,为产学研用各方搭建了深度交流平台,为行业高质量发展提供了新思路。







