ITBear旗下自媒体矩阵:

阶跃星辰Step 3.5 Flash发布,多家芯片厂商适配,共推大模型应用落地

   时间:2026-02-03 03:17:58 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

阶跃星辰正式推出专为实时Agent工作流设计的新一代开源基座模型Step 3.5 Flash,该模型通过技术创新实现了推理速度、智能表现与使用成本的平衡。在单请求代码生成等任务中,其最高推理速度可达每秒350个token,为开发者提供了更高效的底层模型选择。这款被定位为"Agent开发伴侣"的模型,旨在降低大模型应用的技术门槛,推动智能体技术在更多场景的落地。

模型采用稀疏混合专家(MoE)架构,总参数规模达1960亿,但每个token处理仅激活约110亿参数。这种设计在保持模型性能的同时,将推理效率提升至行业领先水平。技术团队表示,通过动态参数激活机制,模型能够根据任务复杂度自动调配计算资源,既保证了复杂任务的处理能力,又避免了简单任务的资源浪费。

在硬件生态建设方面,Step 3.5 Flash已与国内六家主流芯片厂商完成适配。华为昇腾、沐曦股份、壁仞科技等企业通过联合优化,显著提升了模型在国产算力平台上的运行效率。这种软硬协同的创新模式,使得模型推理成本较传统方案降低约40%,为中小企业应用大模型提供了可行路径。多家测试机构的数据显示,适配后的系统在保持精度不变的情况下,能耗降低了近三分之一。

值得关注的是,阶跃星辰今年早些时候联合产业链伙伴发起了"模芯生态创新联盟"。该联盟汇聚了近十家芯片设计、制造及云计算企业,致力于打破模型开发与硬件部署之间的技术壁垒。通过建立统一的标准接口和优化工具链,联盟成员共同探索大模型在金融、医疗、工业等领域的垂直应用。某参与企业负责人透露,联盟正在制定面向Agent开发的算力评估体系,这将为行业提供重要的参考标准。

行业分析师指出,随着大模型从训练阶段转向推理应用,模型架构与硬件架构的深度融合将成为关键趋势。Step 3.5 Flash的推出及其生态建设,恰好契合了这一发展方向。其开源策略不仅降低了技术准入门槛,更通过社区协作加速了技术迭代。目前,该模型已在代码生成、智能客服等场景展开试点应用,部分合作企业反馈其响应速度较前代产品提升超过60%。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version