ITBear旗下自媒体矩阵:

阶跃星辰发布Step 3.5 Flash:1960亿参数模型实现消费级硬件流畅运行

   时间:2026-02-02 18:54:24 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国内人工智能领域迎来新突破,阶跃星辰正式推出其最新开源大模型——Step 3.5 Flash。这款模型以“为Agent而生”为核心定位,在推理效率、智能体能力及长任务稳定性方面实现显著提升,为开发者社区注入全新活力。

技术架构层面,该模型采用稀疏MoE(混合专家)设计,总参数量达1960亿,但通过动态参数激活机制,每个token仅需调用约110亿活跃参数。配合自主研发的MTP-3多token预测技术与3:1滑动窗口注意力架构,模型在保持高精度的同时,将推理速度提升至350 TPS(每秒事务数),并支持256K超长上下文窗口处理。官方测试数据显示,在复杂数学推理与多步骤任务执行场景中,其性能表现较同类模型提升23%以上。

针对不同用户群体,阶跃星辰提供多元化部署方案:开发者可通过OpenRouter平台限时免费调用API接口,或从GitHub、HuggingFace等开源社区下载完整模型权重进行本地化部署;普通用户则能直接通过阶跃AI移动应用及网页端体验交互功能。值得关注的是,本地部署方案经过深度优化,可在消费级硬件上流畅运行,目前已兼容NVIDIA DGX Spark工作站、Apple M3/M4 Max芯片设备及AMD AI Max+ 395显卡等主流硬件配置。

性能对比图表显示,启用Parallel Thinking并行计算模式后,Step 3.5 Flash在深度搜索任务(XBench-DeepSearch基准测试)中的表现超越多数同规模开源模型,甚至与部分闭源商业模型形成有力竞争。这种突破得益于稀疏激活架构带来的计算效率革命——1960亿参数模型的实际计算量被压缩至传统密集模型的1/18,使得消费级设备运行超大规模模型成为现实。

据研发团队透露,下一代Step 4模型已进入训练阶段,该版本将聚焦多模态理解与自主决策能力的升级。为加速技术迭代,阶跃星辰同步开放Discord开发者社区,邀请全球技术爱好者参与模型共创与场景测试,首批合作项目涵盖智能代码生成、复杂系统运维等前沿领域。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version