国内人工智能领域迎来新突破,阶跃星辰正式推出其最新开源大模型——Step 3.5 Flash。这款模型以“为Agent而生”为核心定位,在推理效率、智能体能力及长任务稳定性方面实现显著提升,为开发者社区注入全新活力。
技术架构层面,该模型采用稀疏MoE(混合专家)设计,总参数量达1960亿,但通过动态参数激活机制,每个token仅需调用约110亿活跃参数。配合自主研发的MTP-3多token预测技术与3:1滑动窗口注意力架构,模型在保持高精度的同时,将推理速度提升至350 TPS(每秒事务数),并支持256K超长上下文窗口处理。官方测试数据显示,在复杂数学推理与多步骤任务执行场景中,其性能表现较同类模型提升23%以上。
针对不同用户群体,阶跃星辰提供多元化部署方案:开发者可通过OpenRouter平台限时免费调用API接口,或从GitHub、HuggingFace等开源社区下载完整模型权重进行本地化部署;普通用户则能直接通过阶跃AI移动应用及网页端体验交互功能。值得关注的是,本地部署方案经过深度优化,可在消费级硬件上流畅运行,目前已兼容NVIDIA DGX Spark工作站、Apple M3/M4 Max芯片设备及AMD AI Max+ 395显卡等主流硬件配置。
性能对比图表显示,启用Parallel Thinking并行计算模式后,Step 3.5 Flash在深度搜索任务(XBench-DeepSearch基准测试)中的表现超越多数同规模开源模型,甚至与部分闭源商业模型形成有力竞争。这种突破得益于稀疏激活架构带来的计算效率革命——1960亿参数模型的实际计算量被压缩至传统密集模型的1/18,使得消费级设备运行超大规模模型成为现实。
据研发团队透露,下一代Step 4模型已进入训练阶段,该版本将聚焦多模态理解与自主决策能力的升级。为加速技术迭代,阶跃星辰同步开放Discord开发者社区,邀请全球技术爱好者参与模型共创与场景测试,首批合作项目涵盖智能代码生成、复杂系统运维等前沿领域。











