当前,AI算力的发展正呈现出两种截然不同的趋势。在云端领域,万卡、十万卡级别的集群已成为行业标配,算力规模持续攀升,这主要得益于头部应用日均消耗的Token数量已突破百万亿级别。然而,对于普通用户而言,云端训练出的智能模型在实际使用中却显得不够便捷,往往需要通过手机联网等待数秒才能获得回应。
这一现象引发了业界对算力如何更好地融入日常生活的深入思考。近日,一家专注于国产GPU研发的企业在发布会上推出了多款面向端侧的创新产品,包括家庭智能中枢、AI个人电脑、智能体设备以及具身智能相关解决方案,试图为这一问题提供新的答案。
AICUBE的设计目标是在满足家庭多样化需求的同时,克服多重技术挑战。它不仅能够运行本地大模型,还具备低功耗、静音运行的特点,可7×24小时不间断工作。更重要的是,它确保用户数据完全存储在本地,不上传至云端,同时提供简单易用的语音交互界面,适合各年龄段用户使用。这些特性使得AICUBE成为端侧全功能GPU架构的一次重要实践。
在发布会现场,产品经理演示了AICUBE的多种功能,包括语音控制播放电影、旅行规划、文件自动保存以及AI生成朋友圈文案等。这些功能展示了AICUBE作为AI Agent执行平台、AI PC算力中心和AI NAS私有存储设备的综合实力。与市场上现有的智能音箱或NAS设备相比,AICUBE的优势在于其全功能GPU架构,能够同时处理多种计算任务。
该企业创始人指出,传统的物联网(IoT)概念应升级为智能物联网(Intelligence of Things)。这一观点反映了企业对AI算力发展趋势的深刻洞察。与专注于纯AI训练或图形渲染的竞争对手不同,该企业从成立之初就选择了全功能GPU的发展路线。其自主研发的MUSA架构不区分图形和计算功能,同一芯片可同时支持AI计算、图形渲染、科学计算、物理仿真和超高清视频处理五种能力。
这种多能力整合的设计理念在端侧场景中具有显著优势。例如,在客厅环境中,一颗芯片需要同时驱动4K云游戏、实时数字人互动等应用;在具身智能机器人领域,AI决策和物理世界理解也需要并行处理。纯AI加速路线的芯片虽然算力强大,但难以满足这些多样化的需求。因此,全功能GPU架构成为端侧应用的理想选择。
除了AICUBE,该企业还推出了面向开发者的AIBOOK笔记本电脑和面向工业领域的E300模组。AIBOOK被称为“为智能体而生”的开发工具,搭载基于Ubuntu改造的MTT AIOS原生Linux系统,预装“龙虾”智能体,可本地稳定运行十几个AI Agent,并支持90多个CLI工具接口。这款产品旨在构建一套独立于英伟达CUDA生态的国产GPU开发工具链,从基础笔记本形态开始推动MUSA生态的发展。
MUSA架构作为该企业的核心技术,包含从芯片、硬件、软件栈到生态的完整体系,全面对标CUDA。近年来,该企业持续优化MUSA软件栈,现已支持国内主流大模型如DeepSeek、Qwen、Kimi和MiniMax,并接入了vLLM官方后端,原生适配SGLang主线代码,PyTorch算子覆盖率达到100%。这些进展显著缩小了MUSA与CUDA之间的差距。
然而,构建完整的生态系统仅靠技术适配是不够的。该企业希望通过AIBOOK等产品的推广,吸引更多开发者参与MUSA社区建设,共同完善工具链和开发环境。完整的MUSA软件栈使大模型开发者能够在这款笔记本上直接完成模型训练的核心步骤,为国产GPU生态的成熟奠定基础。
从游戏显卡到云端显卡,再到如今的端侧产品,该企业的产品矩阵日益完善。当云端训练、边缘推理和终端交互共享同一套MUSA架构时,国产算力在迁移成本、适配门槛和生态碎片化等方面的问题有望得到系统性解决。这种发展策略体现了企业对算力普及化的深刻理解:只有让AI算力渗透到数据中心、开发者桌面、工业现场和家庭客厅等各个场景,才能在未来竞争中占据有利地位。
该企业早期推出的游戏显卡MTT S80通过持续的底层重构和驱动迭代,实现了从仅支持DX9到兼容《黑神话:悟空》等中国Top 50热门游戏的跨越,并对其中44款游戏进行了专门优化。这种工程能力如今也被应用到端侧产品的开发中,成为企业的重要竞争优势。
在算力竞争日益激烈的今天,该企业选择了一条差异化的发展道路。通过全功能GPU架构和端侧产品的布局,企业不仅降低了国产算力的迁移成本,还为AI技术的普及化应用提供了新的可能。这种战略选择或许预示着,未来的智能物联网时代将属于那些能够在多个场景中提供全面解决方案的技术提供商。








