在2025世界人工智能大会(WAIC 2025)期间,由清华大学背景团队创立的AI基础设施企业无问芯穹,正式发布了覆盖全规模算力的AI效能提升方案,并同步推出无穹AI云、无界智算平台、无垠终端智能三大核心产品。该方案通过软硬件协同设计,构建起从单卡到十万卡级算力的全场景支持体系,实现跨地域智算网络、大型集群与终端设备的统一资源调度。
针对不同算力规模的应用场景,无问芯穹设计了差异化解决方案:无穹AI云聚焦万卡至十万卡级超大规模算力网络,无界智算平台服务百卡至千卡级智算集群,无垠终端智能则面向单卡至十卡级消费级设备。该体系通过统一适配多种异构芯片,提供从模型训练优化到应用部署的全流程支持,有效解决国内算力生态碎片化问题。
在产品落地层面,无问芯穹与智谱华章达成深度合作。7月29日凌晨,无穹AI云平台率先上线GLM-4.5(3550亿参数)及GLM-4.5-air(1060亿参数)两款开源大模型。这两款性能达全球第三的模型,与近期全球走红的DeepSeek、Kimi K2等开源项目形成技术共振,共同推动AI基础设施与模型研发的协同进化。
公司联合创始人兼CEO夏立雪指出,当前国内算力市场存在显著生态割裂问题。不同厂商的芯片在架构设计、接口协议等方面差异巨大,导致开发者需要投入大量资源适配硬件,严重制约AI技术落地效率。无问芯穹通过构建"算力通用语言",实现跨品牌芯片的无缝协同,使算力资源像商品一样自由流通。
在技术融合路径上,夏立雪强调模型研发与芯片设计的双向驱动关系。他以海外生态为例指出,英伟达与OpenAI的闭环合作创造了技术迭代优势。国内需要建立类似的生态闭环,通过打通需求信息与资源供给,指导芯片厂商优化内存容量、访存速度等关键指标,而非单纯追求制程工艺的突破。
成立于2023年5月的无问芯穹,已快速成长为AI基础设施领域的领军企业。其打造的"M×N"中间层解决方案,通过AI云平台与算力优化服务,为智算中心、模型厂商及行业客户提供全链条支持。2024年完成的近5亿元A轮融资,创下国内该领域单笔融资纪录,使公司累计融资超10亿元。
在国产化适配方面,无问芯穹取得突破性进展。通过对十余种国产AI芯片的深度优化,实现开源模型无缝迁移,使国产芯片性能提升50%-200%。其多源异构调度技术可统一管理不同品牌芯片,综合性价比超越国际主流产品。在上海模速空间的实践中,日均Tokens调用量突破100亿次,支撑超过100个创新应用,单应用月活跃用户达数千万。
产品创新层面,无问芯穹推出多项行业首创技术。无界智算平台通过智能调度,成功在2000张华为昇腾910B芯片上实现千亿参数模型部署。其跨地域分布式强化学习服务,可将分散算力资源整合为中等规模集群,支持单张消费级显卡接入训练。目前,已与三大运营商及20余家算力中心启动联合运营生态计划。
在端侧计算领域,无问芯穹与联想、新华三等企业合作推出创新产品。与上海创智院联合开发的端侧本征模型,将本地模型参数规模从70亿提升至300亿;与苏州异格技术合作的FPGA推理一体机,单机可驱动百亿参数模型,能效提升一倍的同时降低推理成本。这些突破使中小企业也能训练专属领域模型。
针对H20芯片恢复供应的市场变化,夏立雪认为长期影响有限。他指出国内产业已适应封禁与解禁的周期性波动,当前更关注推理场景的国产化替代。通过平台迁移服务,帮助客户将训练任务逐步转向国产芯片,目前已在多款国产卡上实现商业价值闭环。
清华大学电子工程系主任汪玉教授从产业生态角度指出,打通算力、数据、模型、应用的全链条,需要兼具技术深度与商业视野的复合型人才。这类人才既能理解垂直领域技术细节,又掌握跨领域资源整合能力,是推动AI技术落地的关键力量。教育、科研与产业界需共同培养此类战略型人才。
夏立雪总结道,无问芯穹将持续通过场景扩展、资源优化与效率提升的三维共振,实现"智无边际、算无虚发"的愿景。公司致力于让每个计算节点都能释放智能潜力,推动AI技术从实验室走向千行百业。