滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

曦望启望S3推理GPU亮相：聚焦单位Token成本，国产GPU开启新征程

时间：2026-01-28 04:35:39 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

国产GPU厂商曦望（Sunrise）在杭州举办的首届Sunrise GPU Summit上，发布了新一代推理GPU芯片启望S3，并同步推出面向大模型推理的超节点方案及推理云计划。这一动作标志着曦望在完成近一年约30亿元战略融资后，首次系统性展示其技术路线与产品布局，为国产GPU产业从“参数竞争”转向“成本竞争”提供了新范式。

与传统GPU厂商聚焦“训推一体”不同，曦望选择了一条差异化路径：启望S3不追求峰值训练性能，而是将全部资源投入推理效率与单位成本优化。曦望联席CEO王勇在发布会上指出，大模型产业正从训练主导转向推理主导，GPU的商业价值将取决于单位Token的真实成本，而非参数指标。这一判断直接影响了芯片设计逻辑——启望S3围绕真实推理负载，对算力结构、存储体系和互联方式进行系统性重构。

在算力设计上，启望S3支持从FP16到FP4的多精度灵活切换，通过低精度推理效率最大化释放算力潜力，精准匹配MoE（混合专家模型）和长上下文模型在推理阶段的实际需求。存储方面，该芯片采用LPDDR6显存方案，成为国内首款搭载该技术的GPU，显存容量较上一代提升4倍，有效缓解了大模型推理中的显存驻留与访存瓶颈。官方数据显示，在DeepSeek V3/R1等主流模型推理场景中，启望S3的单位Token成本较上一代下降约90%，且这一指标已通过工程验证，具备可复现性。

针对千亿、万亿级参数多模态MoE模型的部署需求，曦望同步推出寰望SC3超节点解决方案。该方案支持单域256卡一级互联，可高效支撑PD分离架构与大EP（Expert Parallelism）规模化部署，系统利用率与稳定性显著提升，适配长上下文、多并发、多专家并行等复杂推理场景。在交付形态上，寰望SC3采用全液冷设计，PUE（电源使用效率）表现极致，并支持模块化部署，将整体系统交付成本从行业常见的亿元级降至千万元级，降幅达一个数量级。

软件生态层面，曦望构建了与CUDA兼容的基础软件体系，覆盖驱动、运行时API、开发工具链、算子库和通信库，降低推理应用迁移门槛。目前，该体系已适配ModelScope平台90%以上主流大模型，包括DeepSeek、通义千问等，为开发者提供无缝切换的兼容性支持。

曦望的野心不止于芯片本身。通过与商汤科技、第四范式等生态伙伴合作，曦望探索推理云平台，试图解决“推理算力如何更好用”的问题。该平台通过GPU池化与弹性调度，将底层算力整合为统一推理池，并以MaaS（Model as a Service）模式向企业开放，用户无需关注硬件配置与集群运维，即可按需调用大模型推理能力。这一体系成为曦望“百万Token一分钱”推理成本合作的技术基础。

曦望董事长徐冰在会上强调，推理时代的核心是持续、稳定地将算力转化为可交付的生产力，而非单纯销售芯片。数据显示，2025年曦望推理GPU芯片交付量已突破1万片，标志着其路线从工程验证迈向规模化落地。中国工程院院士吴汉明指出，推理算力的价值实现需要芯片设计、系统集成、软件开发到产业应用的全链条协作，曦望的实践为国产GPU产业提供了重要参考。

更多>同类资讯

上海科技馆焕新升级！十大展区亮相，春节试开放共赴科技盛宴

01-28

聚焦AI战略转型，图片社交平台Pinterest宣布裁员15%以优化资源配置

01-28

破除AI幻觉困局：以技术迭代之笔，绘就精准可靠服务新画卷

01-28

AIGC智能体全解析：从本质到构建，解锁人工智能自主决策新路径

《AIGC专题：AIGC智能体(本质、结构以及如何构建)》指出，智能体是能通过传感器感知环境、经决策后通过执行器作用于环境的自主实体，LLM为其提供核心“大脑”，是通往AGI的关键路径，与AIGC在内容生成…

01-28

新疆保华润天航空解读：无人驾驶车辆与无人机技术差异、应用挑战及未来趋势

两者虽然同属无人系统，但在技术路径、应用场景及系统演进方面呈现出不同的特点与挑战。从系统架构演进来看，无人驾驶车辆正从封闭测试场景逐步走向开放道路，其控制系统呈现出集中与分布式结合的趋势，并强调车路协同与云…

01-28

上海发布全球最大“视触觉”数据集助力机器人突破感知瓶颈迈向精细操作

此次发布的白虎-VTouch数据集，由国家地方共建人形机器人创新中心（下称“国地中心”）联合上海纬钛科技有限公司共同发布，核心目的就是要补齐具身智能缺失的“触觉与接触”数据拼图，为构建真正具备物理理解与精细…

01-28

《上海智能机器人百大场景案例集：前沿技术赋能多领域发展新图景》

今天分享的是：报告共计：398页《上海智能机器人百大场景案例集》由上海人工智能研究院编制、上海市经济和信息化委员会指导，于2025年9月发布，聚焦上海智能机器人标杆企业的创新示范应用，遴选百个具有示范性、…

01-28

致景科技凭AI赋能纺织数智化转型荣登2025中国独角兽TOP100榜单

致景科技凭借AI技术助力纺织服装全产业链数智化转型的创新实践与实际成效，入选2025年度中国独角兽TOP100榜单。致景科技凭借AI技术助力纺织服装全产业链数智化转型的创新实践与实际成效，入选2025年度中国…

01-28

成都卡诺普中东展会大放异彩，与超12家伙伴达成合作意向展实力

记者27日获悉，在阿联酋沙迦举行的国际金属加工及焊接技术展览会（Steel Fab 2026）上，来自成都市成华经开区的机器人领军企业——成都卡诺普机器人技术股份有限公司，以其先进的产品技术与深度本地化服务策…

01-28

生产级AI智能体搭建指南：RAG赋能+FastAPI部署+全链路成本安全管控

这种模式通过计量工具使用、强制形状和安全的护栏、优先考虑相关上下文的RAG，以及可监控和扩展的API来实现这一目标。 A：通过多种策略控制成本：使用便宜的模型（如gpt-4o-mini）进行规划任务，为关键提…

01-28

智能体与技能：并非非此即彼，携手共筑AI应用新架构

智能体是完整的决策实体，具备系统提示、工具访问、支撑模型（如Claude、ChatGPT等）以及让它们能够协调工作流程和管理状态的智能体循环。智能体AI的未来不是在智能体和技能之间做选择，而是在正确的时间…

01-28

马年春晚机器人“组团”来袭，优必选、宇树、银河谁能引领新潮流？

与优必选、宇树科技这两位多次在春晚舞台上大放异彩的“前辈”相比，银河通用在产品布局方面展现出了更为“专精”的独特风格。雷达财经从公司官网获悉，魔法原子成立于2024年1月，专注于通用机器人和具身智能技术研…

01-28

铠侠新一代UFS 4.1闪存样品亮相，性能提升满足移动存储高要求

01-28

聚焦AI战略布局，Pinterest宣布裁员15%以优化资源配置推进发展

01-28

马云谈AI时代教育：聚焦好奇心培养，助学生提出万千独特好问题

01-28

点击查看更多 +

全站最新

迈越科技李常青：十二载携手华为，从合作到共创共赴智能新征程

春晚舞台上的科技狂欢：魔法原子如何让机器人“破圈”又“落地”？

蚂蚁灵波科技开源LingBot-Depth模型，为机器人三维视觉带来新突破

全家携手飞书构建数字新基建，以数智协同赋能零售行业高效发展

小米YU7斩获2025微博年度纯电车型殊荣，雷军致谢并分享亮眼交付成绩

卡车也会"智慧运算"？中国重汽智能辅助驾驶，给出干线物流增效最优解

热门内容

本栏最新

蚂蚁灵波科技开源LingBot-Depth模型，为机器人三维视觉带来新突破

长城2026新车规划亮点多：坦克800国产，归元平台首车，还有V8超跑来袭

特斯拉奥斯汀开放无安全员Robotaxi服务，乘客38次叫车未果运营规模待扩大

跨境电商新引擎：Hilight一键生成商用视频，AI驱动营销变革新篇章

从“人找桩”到“桩找车”，岚图汽车智慧超充站破百引领补能新变革

精智实业赴港上市：2025年前9月营收4.18亿多元业务布局显成效

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.