AIPress.com.cn报道
国产大模型开源阵营又添一员。
2月2日,阶跃星辰发布Step 3.5 Flash,定位为“为Agent而生”的开源基座模型,主打推理速度、Agent能力和长链条任务稳定性。
这款模型的参数总量达到1960亿,但采用稀疏MoE架构,每个token仅激活约110亿参数。配合MTP-3多token预测机制和3:1滑动窗口注意力架构,官方宣称推理速度最高可达350 TPS,支持256K上下文长度。核心卖点是三个词:更快、更强、更稳——快在推理速度,强在Agent和数学任务表现,稳在复杂长链条任务的可靠性。
阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。
部署方式上,阶跃星辰这次给得很全。开发者可以通过OpenRouter限时免费调用API,也可以从GitHub和HuggingFace下载模型权重自行部署。普通用户则可以在阶跃AI的App和网页端直接体验。
值得注意的是本地部署的支持范围。官方表示已专门优化本地运行性能,支持在个人工作站上流畅运行,兼容设备包括NVIDIA DGX Spark、Apple M3/M4 Max以及AMD AI Max+ 395。一个1960亿参数的模型能在消费级硬件上跑起来,背后是稀疏激活架构带来的实际计算量压缩,110亿的激活参数让这件事成为可能。
阶跃星辰还透露,Step 4模型已启动训练,并开放Discord社区邀请开发者参与共创。











