滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

阶跃Step 3.5 Flash：以巧破局，在Agent时代走出高效创新之路

时间：2026-02-03 19:40:06 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当前人工智能领域正经历一场范式转变，类似2008年智能手机市场从功能机向智能机的跨越。当行业普遍陷入参数规模竞赛时，阶跃星辰推出的Step 3.5 Flash模型以反常规路径引发关注。这款采用稀疏混合专家架构的模型，在总参数规模仅1960亿的情况下，通过动态激活机制使每个token仅调用110亿参数，在智能评估中取得第二名的成绩，展现出架构创新对性能提升的关键作用。

行业观察指出，现有大模型发展路径存在明显局限。多数厂商仍在延续L1聊天机器人时代的思维范式，通过扩大参数规模追求性能提升。但面对L3智能体时代对长上下文处理、实时响应和工具调用的新要求，这种路径逐渐显现出算力消耗大、响应效率低等问题。就像用重型卡车运输轻便货物，不仅造成资源浪费，更难以适应复杂场景需求。

Step 3.5 Flash的技术突破体现在对注意力机制的革新。该模型采用的滑动窗口注意力架构，突破传统Transformer的二次计算复杂度限制，在处理256K超长上下文时仍能保持高效。这种设计使模型在代码生成、深度搜索等任务中展现出惊人速度，单请求推理速度最高达350 tokens/s，在OpenRouter最新评测中位列全球前三。测试数据显示，其数学推理能力在AIME 2025等权威基准测试中均取得国内开源模型最高分。

模型在实用场景中的表现尤为突出。在真实开源项目bug修复任务中取得74.4分，终端自动化任务处理达到51分，实时编码调试能力获86.4分。更引人注目的是其多步任务规划能力，在τ²-Bench评测中以88.2分领先国内同类模型。当面对"0-3岁婴幼儿科学教育"这类开放课题时，模型能自主完成信息检索、逻辑梳理和报告生成的全流程，产出结构完整的专业报告，展现出真正的智能体工作模式。

终端部署能力成为该模型的另一大亮点。通过4-bit量化技术，模型可在128GB内存的MacBook上流畅运行256K上下文窗口，这在当前大模型中尚属首次。这种突破意味着高性能AI不再依赖云端算力集群，个人开发者和小型企业也能以低成本获得顶级AI能力。技术团队透露，这种设计源于对AGI发展路径的深度思考——真正的智能应该像电力一样触手可及。

行业分析认为，Step 3.5 Flash的出现标志着大模型竞争进入新阶段。当参数规模竞赛触及物理极限，架构创新和效率优化将成为制胜关键。该模型在数学推理、代码生成等核心能力上的突破，证明通过优化计算路径和注意力分配，中小规模模型同样能达到甚至超越万亿参数模型的效果。这种技术路线不仅降低研发成本，更为AI在边缘设备上的普及铺平道路。

随着AI技术向纵深发展，行业对模型的评价标准正在发生转变。从单纯追求参数规模转向关注实际任务完成度，从比拼榜单分数转向考察真实场景表现。Step 3.5 Flash在深度搜索、工具调用等智能体核心能力上的领先，预示着下一代AI模型的发展方向。这种转变或将重塑整个AI产业格局，推动技术从实验室走向千行百业。

更多>同类资讯

DeepSeek前核心研究员阮翀加盟，元戎启行加速自动驾驶大模型技术布局

04-27

GPT-5.5提示词新指南：告别冗长旧指令，精简沟通解锁更强性能

04-27

一张照片开启3D世界探索之旅灵光App移动端世界模型体验来袭

04-27

Anthropic“Project Deal”实验：Claude自主交易186笔，AI“代理经济”迈入实操阶段

04-27

OpenAI联合高通联发科发力手机芯片，立讯精密独家代工2028年或开启AI终端新纪元

04-27

富士通与卡内基梅隆大学携手，共筑物理AI操作系统开启人机协作新篇

04-27

OpenAI技术革新：Codex告别独立时代编程能力深度融入GPT-5.5主模型

04-27

元戎首席科学家阮翀首秀：基座模型破局智驾困境，驱动组织AI变革

04-27

海康存储北京车展秀实力：多款车载新品亮相，赋能汽车智能化新未来

04-27

国家超算互联网限时免费开放DeepSeek-V4对话开启百万上下文普惠新篇

来源：环球网【环球网科技综合报道】4月26日，国家超算互联网宣布，限时推出免费DeepSeek-V4对话服务，依托国产普惠算力的支撑，让用户感受百万上下文的极速推理体验。国家超算互联网表示，DeepSe…

04-27

2026北京车展双馆联动规模空前，多元创新展现中国汽车产业蓬勃生机

04-27

中国汽研北京车展首秀：三大计划引领方向三项成果彰显实力

04-27

360启动ADE认证全国渠道伙伴计划，加速AI智能体人才规模化培养

近日，360 ADE认证全国渠道伙伴计划启动会暨ISC.AI ADE师资训练营在北京举行。来自行业机构、教育领域及全国渠道合作伙伴代表齐聚现场，围绕人工智能智能体时代的人才培养展开深入交流。会上，360正式发布ADE认证渠道合作战略，标志着其在AI人才培养领域进入规模化发展

04-27

芯擎科技“龍鹰二号”5nm车规级AI座舱芯片亮相，算力强劲助力舱驾融合新体验

04-27

Gartner预测：2026年全球数据中心及IT支出将大幅增长，AI成关键驱动力

04-27

点击查看更多 +

全站最新

港股通讯概念股逆势上涨，长飞光纤光缆涨超6%

澳股收跌0.23%

首次收于6万点以上！日股收盘再创历史新高，年内累涨20.26%

韩股收盘再创历史新高，年内累涨56.97%，继续牛冠全球，三大股指总市值首次突破6000万亿韩元

腾讯跌超3%逼近前低

元戎首席科学家阮翀首秀：基座模型破局智驾困境，驱动组织AI变革

热门内容

本栏最新

元戎首席科学家阮翀首秀：基座模型破局智驾困境，驱动组织AI变革

海康存储北京车展秀实力：多款车载新品亮相，赋能汽车智能化新未来

国家超算互联网限时免费开放DeepSeek-V4对话开启百万上下文普惠新篇

欣旺达北京车展秀实力：“欣星环”电池发布，“能量家生活馆”引领新能源生活

吉利第5代帝豪i-HEV智擎混动北京车展首秀动力节能安全全面升级

2026北京车展|日产汽车：以中国为支点，撬动全球新能源与智能化新布局

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.