在万众瞩目的2025世界人工智能大会即将拉开帷幕之际,阶跃星辰公司于上海震撼发布了其最新力作——Step 3基础大模型。这款模型定于7月31日向全球企业及开发者开放源代码,标志着人工智能领域的一次重要革新。
Step 3不仅是阶跃星辰首个全尺寸、原生多模态推理模型,更是模型架构创新与算法工程协同设计的集大成者。它采用了先进的MoE架构,拥有高达3210亿的参数量,其中激活参数量达到380亿。这一突破性的设计,使得Step 3在兼顾模型效果的同时,也大幅降低了推理成本。
Step 3凭借其强大的视觉感知与复杂推理能力,在跨领域知识理解、数学与视觉信息的交叉分析以及日常生活中的视觉分析问题上展现出卓越的性能。在多个权威榜单,如MMMU、MathVision、SimpleVQA、AIME 2025以及LiveCodeBench等,Step 3均取得了开源多模态推理模型的顶尖成绩,彰显了其行业领先地位。
值得注意的是,Step 3在推理效率上也实现了重大突破。针对主流开源模型在解码效率上的局限性,尤其是在国际高端芯片以外的平台上,Step 3在架构设计阶段便充分考虑了系统与硬件的特性,确保了在不同硬件平台上的高效推理。实验数据显示,在国产芯片上,Step 3的推理效率最高可达DeepSeek-R1的300%,同时在NVIDIA Hopper架构芯片上进行分布式推理时,吞吐量也实现了超过70%的提升,且这一切均未牺牲激活参数量或降低注意力容量。
为了进一步推动人工智能与硬件生态的融合发展,阶跃星辰携手近10家芯片及基础设施厂商,共同发起成立了“模芯生态创新联盟”。首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程以及硅基流动等知名企业。目前,华为昇腾芯片已率先实现了Step 3的搭载与运行,沐曦、天数智芯和燧原等厂商也已完成初步适配,其他联盟成员的适配工作正在紧锣密鼓地进行中。