滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

清程极智团队揭秘：Token服务差异大，AI基础设施如何破局？

时间：2026-05-26 22:34:16 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

北京AI基础设施领域迎来一家新锐企业清程极智的阶段性成果展示。这家脱胎于清华大学计算机系高性能计算团队的创业公司，在成立不到三年时间内已完成三轮融资，获得北京市人工智能产业基金、联想集团和中科创星等机构注资。公司今日向媒体披露，其自主研发的智能计算软件栈、大模型推理引擎及服务评测平台已形成完整技术矩阵，覆盖从训练到推理再到应用落地的全链条需求。

针对当前大模型应用中日益突出的Token服务乱象，清程极智推出AI Ping评测平台。该系统通过北京、上海、深圳、成都四地分布式节点，对市场上主流Token服务商进行7×24小时匿名测试。测试数据显示，不同服务商在首Token延迟、吞吐量、上下文支持长度等核心指标上存在四至五倍差异。更值得关注的是，部分厂商通过低单价吸引用户，却因缓存命中率低下导致实际使用成本激增，这种"价格陷阱"在评测中被系统化暴露。

在技术实现层面，AI Ping采用动态输入机制防止服务商针对性优化，其评测结果与头部云厂商内部监控数据误差控制在1%以内。通过智能路由调度系统，该平台已帮助用户降低超37%的Token采购成本，同时将服务可用率提升至99.99%以上。这种"模型导航"功能对中小企业尤其具有价值，解决了其独立评测多供应商的技术门槛和成本障碍。

公司另一核心产品赤兔推理引擎则聚焦国产算力适配。区别于简单移植国外开源方案，该引擎从底层架构开始重构，针对昇腾、沐曦、海光等国产芯片特性优化计算流程。通过软件实现FP8/FP4量化支持，在无硬件加速的国产GPU上仍能保持可用性能，有效降低推理成本。测试数据显示，搭载赤兔引擎的系统在国产芯片上可实现每秒处理数万Token，吞吐量较通用方案提升90%以上。

技术团队透露，赤兔引擎的研发受益于高性能计算领域数十年积累。在流体力学模拟、药物设计等传统计算领域积累的并行优化经验，为大模型推理引擎开发提供了重要参考。这种跨领域技术迁移，使得国产芯片在AI场景下的性能发挥效率显著提升，算子库手工优化与编译器自动优化相结合的策略，有效减少了数据搬运带来的性能损耗。

面对国产算力生态碎片化现状，清程极智选择站在系统级优化角度突破。技术负责人指出，当前国产芯片厂商各自建设生态体系，但底层技术需求存在共性。通过开发通用型软件栈，既能避免重复造轮子，又能加速形成产业合力。这种定位已获得多家国产芯片厂商认可，相关适配工作正在持续推进。

在应用趋势判断上，团队观察到长上下文、多轮交互等新型应用正在改变Token消耗模式。虽然市场价格持续走低，但实际需求增长速度更快，算力供给仍面临压力。通过AI Ping的智能调度系统，可在全国范围内实现算力余缺调剂，既提升资源利用率，又为用户创造新的成本优势。这种基于实时数据的资源调配模式，正在重塑Token服务的市场格局。

关于模型架构演进，技术专家认为通用人工智能（AGI）目标尚未收敛，自回归架构之外的技术路线值得关注。去年蚂蚁集团探索的扩散机制语言模型，以及谷歌在多模态统一模型方面的尝试，都预示着行业可能迎来新的技术突破。这种持续创新的环境，对底层基础设施的灵活性和扩展性提出了更高要求，也为AI Infra领域创造了持续发展空间。

更多>同类资讯

DeepSeek大扩军：从模型突破到平台化，如何平衡规模与锋利？

06-27

从旷视“5号员工”到极豪掌门人，90后清华学霸陈可卿携极豪冲刺IPO

06-27

百度文心升级：AI从“展示能力”迈向“交付结果”新征程开启

06-27

反内卷浪潮下，七大快递巨头国内“洗牌”与海外“突围”战况如何？

06-27

无界动力再获超2亿美元天使轮融资全球订单近亿创始人履历亮眼

06-27

沃尔玛“沃集鲜”上新不断，平价健康新品成年轻人购物新宠

06-27

京东方：5000亿资本投入后，借玻璃基板能否开启新股价篇章？

06-27

佳和影城2026年多部影片热映中四渡赤水玩具总动员等场次时间一览

给阿嬷的情书丨四月三十日他本着军人的高度警惕和公安战士的责任感，硬是与冯搭做邻居，穷尽一生历尽磨难，进行了一场近四十年无怨无悔的追踪。在管理店铺日渐萎缩的财务时，克拉克向电工问起那异常高昂的电费和灯光总是闪…

06-27

太空“占座战”激战正酣：美领跑俄守核，中国加速追赶成亮点

06-27

计算机安全领域顶尖学者宋晓冬携团队加盟Meta，助力AI安全新发展

本周四，UC Berkeley 计算机教授 Dawn Song（宋晓冬）宣布加入 Meta 超级智能实验室 SuperintelligenceLabs，担任 AI 研究副总裁。宋晓冬的研究不仅覆盖传统的…

06-27

电脑价格疯涨，刚需、入门、观望人群该如何理性应对？

06-27

汽水音乐&抖音生态升级：从爆款孵化到构建可持续音乐成长生态

06-27

OpenAI携手博通推出首款AI芯片Jalapeño：AI加速设计，9个月高效流片

如今 AI 的算力需求越来越大，各家公司对于芯片的需求也日益迫切，Brockman 表示 OpenAI「无法获得足够快的算力」，博通首席执行官陈福阳也支持这一观点，称该公司六家客户的计算需求「简直是永无止境…

06-27

500亿到账后，DeepSeek专注技术深挖，商业化暂未成首要目标

06-27

上海整治AI乱象成果显著：清理违规信息487万条下架1.4万智能体

06-27

点击查看更多 +

全站最新

佳和影城2026年多部影片热映中四渡赤水玩具总动员等场次时间一览

Avinox新一代电助力系统登场，超60家品牌携手，开启智能高效骑行新篇章

华为杨扬MWC上海演讲：AI赋能产品服务驱动通信业Token经营新跃升

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

郑州产业互联网定制平台：柔性服务全覆盖，满足多元物料定制新需求

全固态电池来袭：续航充电双突破，量产普及在望，出行焦虑将成历史？

热门内容

本栏最新

佳和影城2026年多部影片热映中四渡赤水玩具总动员等场次时间一览

全固态电池来袭：续航充电双突破，量产普及在望，出行焦虑将成历史？

openJiuwen亮相开放原子开源生态大会携手伙伴共筑AgentOS繁荣生态新未来

本田上市69年首现年度亏损：2025财年净亏4239亿，电动化战略致巨亏后调整方向

高通骁龙8E6系列9月登场！2nm工艺加持小米18系列两款机型将首发

小米18 Pro规格疑曝光：双2亿像素主摄加持骁龙8 Elite Gen 6芯片或成亮点

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.