在2025世界人工智能大会即将拉开帷幕之际,阶跃星辰公司于上海隆重揭晓了其最新研发成果——Step 3基础大模型。据悉,这一创新模型将于7月31日向全球范围内的企业及开发者开放源代码。
作为阶跃星辰首个全方位、原生支持多模态推理的模型,Step 3在模型效能与推理成本之间取得了巧妙的平衡。该模型采用了先进的MoE架构,拥有总计3210亿的参数规模,在激活状态下则可调动380亿参数。这一设计不仅是一次技术上的大胆探索,也是模型规模扩展(Scale Up)实践中的一次重要尝试。
Step 3展现了卓越的视觉感知与复杂推理能力,它能够跨越不同领域,精准理解复杂知识,实现数学与视觉信息的深度融合分析,并解决日常生活中的各类视觉难题。在MMMU、MathVision、SimpleVQA等多个权威榜单上,Step 3均取得了开源多模态推理模型的顶尖成绩,彰显了其强大的技术实力。
值得注意的是,尽管当前主流开源模型在解码方面进行了大量优化,但这些方案大多针对国际高端芯片设计,在中端及国产芯片上的表现仍有待提升。阶跃星辰在开发Step 3时,充分考虑了系统与硬件的特性,确保了模型能在广泛的硬件平台上实现高效推理。通过系统和架构的创新,Step 3在推理解码效率方面达到了行业领先水平。
具体而言,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,并且对所有类型的芯片均表现出良好的兼容性。在采用NVIDIA Hopper架构的芯片上进行分布式推理时,Step 3相较于DeepSeek-R1的吞吐量提升超过了70%。这些成就均在不减少激活参数量、不降低注意力容量的前提下实现。
为了进一步推动模型与芯片技术的融合创新,阶跃星辰携手近10家芯片及基础设施领域的领先企业,共同发起了“模芯生态创新联盟”。首批联盟成员涵盖了华为昇腾、沐曦、壁仞科技、燧原科技等多家知名企业。目前,华为昇腾芯片已成功搭载并运行Step 3,沐曦、天数智芯和燧原等企业也初步实现了Step 3的运行,其他联盟成员的适配工作正在紧锣密鼓地进行中。