在2025世界人工智能大会即将拉开帷幕之际,上海迎来了阶跃星辰公司的新一代基础大模型发布盛会。7月25日,阶跃星辰正式揭晓了其倾力打造的Step 3大模型,这一举动标志着公司在人工智能领域迈出了重要一步。
作为阶跃星辰的主力基座模型,Step 3不仅智能高效,更是专为推理时代设计,力求成为最贴合实际应用需求的模型。据官方介绍,该模型将于7月31日向全球企业和开发者开放源代码,为全球开源社区带来一款顶尖的多模态推理模型。
在发布会上,阶跃星辰还宣布了一个重大举措:联合多家国内领先的芯片与平台厂商,共同发起“模芯生态创新联盟”。这一联盟旨在通过促进模型与芯片产业链的协同创新,加速大模型应用的落地进程,推动整个行业的快速发展。
阶跃星辰的创始人兼CEO姜大昕分享了公司的研发理念。他表示,经过Step 1和Step 2两代模型的快速迭代,公司深刻认识到回归客户需求、立足真实应用场景的重要性。正是基于这一出发点,阶跃星辰研发出了新一代Step 3基础模型。
Step 3作为阶跃星辰的首个全尺寸、原生多模态推理模型,在模型架构创新和算法工程协同设计上实现了大胆突破。该模型采用MoE架构,总参数量达到321B,激活参数量为38B。在性能上,Step 3显著提升了视觉感知和复杂推理能力,能够准确完成跨领域的知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。
在多个权威榜单上,Step 3取得了开源多模态推理模型的顶尖成绩,包括MMMU、MathVision、SimpleVQA、AIME 2025以及LiveCodeBench等。在成本方面,Step 3在国产芯片上的推理效率表现出色,最高可达DeepSeek-R1的300%,且对所有芯片均表现出良好的兼容性。在基于NVIDIA Hopper架构的芯片上进行分布式推理时,Step 3的吞吐量相较于DeepSeek-R1提升了超过70%,且这一提升是在不牺牲激活参数量、不降低注意力容量的前提下实现的。
目前,Step 3已经授权给国内多家芯片公司,其中华为昇腾芯片已经成功搭载并运行Step 3。沐曦、天数智芯和燧原科技等公司也已初步实现Step 3的运行,其他厂商的适配工作也在紧锣密鼓地进行中。
除了发布Step 3模型外,阶跃星辰还宣布将与近10家芯片及基础设施厂商共同发起“模芯生态创新联盟”。这一联盟的成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程以及硅基流动等。联盟旨在打通芯片、模型和平台的全链路技术,推动整个生态系统的协同发展。