阶跃星辰正式推出新一代开源Agent基座模型Step 3.5 Flash,该模型专为实时Agent工作流场景设计,采用稀疏MoE架构,总参数量达1960亿,每个token仅激活约110亿参数,在保持高效推理能力的同时有效控制了使用成本。这一技术突破为开发者在规模化应用中面临的稳定性、响应速度和成本问题提供了解决方案。
针对当前开发者从提示词工程向Agent与Workflow构建转型过程中遇到的共性挑战,Step 3.5 Flash通过专项优化实现了显著性能提升。在单请求代码类任务中,该模型推理速度最高可达每秒350个token,能够满足多步推理场景下对低延迟的严苛要求。这种设计使其在需要快速响应的复杂任务中表现出色,例如实时数据处理和动态决策支持。
实际应用测试显示,Step 3.5 Flash展现出强大的自动化能力与跨平台协同特性。该模型可根据自然语言指令自动构建复杂的可视化地理空间系统,同时作为"云端大脑"将用户需求拆解为多个子任务,协调本地设备完成跨平台数据分析。为保障数据隐私和本地算力利用,模型针对主流个人工作站进行了深度优化,支持在NVIDIA DGX Spark、Apple M3/M4 Max及AMD AI Max+ 395等设备上流畅运行。
开发资源方面,Step 3.5 Flash已通过多渠道同步上线,开发者可在OpenRouter、GitHub及阶跃AI官方平台免费试用并快速部署。生态建设取得重要进展,华为昇腾、沐曦股份、壁仞科技等六家芯片厂商已完成模型适配工作,为不同硬件环境下的应用提供了技术保障。这种广泛的硬件支持体系显著降低了模型落地门槛,加速了技术普及进程。
在模型迭代方面,阶跃星辰同步披露了下一代产品Step 4的研发动态。该公司已启动Step 4的训练工作,并创新性地引入开发者共建模式,邀请行业伙伴共同参与基础模型的定义与开发。这种开放协作模式旨在整合多方技术优势,推动Agent基础模型向更高水平发展。目前,阶跃星辰已形成覆盖语言、多模态及端云结合领域的完整模型矩阵,累计发布超30款专业模型。
技术突破持续涌现,阶跃星辰本月发布的视觉语言模型Step-3 VL-10B在同规模模型中达到SOTA性能水平,原生语音推理模型Step-Audio-R1.1更登顶Artificial Analysis Speech Reasoning全球榜单。这些成果印证了该公司在AI+终端体系的技术积累。回顾发展历程,阶跃星辰于去年7月联合产业链伙伴成立"模芯生态创新联盟",通过软硬件联合优化提升算力效率,此次新模型发布可视为该战略的延续与深化。











