ITBear旗下自媒体矩阵:

阶跃星辰Step 3大模型发布,携手华为昇腾等成立模芯生态创新联盟

   时间:2025-07-26 10:03:40 来源:电厂编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在2025世界人工智能大会即将拉开帷幕之际,上海迎来了阶跃星辰公司的新一代基础大模型发布盛会。7月25日,阶跃星辰正式揭晓了其倾力打造的Step 3大模型,这一举动标志着公司在人工智能领域迈出了重要一步。

作为阶跃星辰的主力基座模型,Step 3不仅智能高效,更是专为推理时代设计,力求成为最贴合实际应用需求的模型。据官方介绍,该模型将于7月31日向全球企业和开发者开放源代码,为全球开源社区带来一款顶尖的多模态推理模型。

在发布会上,阶跃星辰还宣布了一个重大举措:联合多家国内领先的芯片与平台厂商,共同发起“模芯生态创新联盟”。这一联盟旨在通过促进模型与芯片产业链的协同创新,加速大模型应用的落地进程,推动整个行业的快速发展。

阶跃星辰的创始人兼CEO姜大昕分享了公司的研发理念。他表示,经过Step 1和Step 2两代模型的快速迭代,公司深刻认识到回归客户需求、立足真实应用场景的重要性。正是基于这一出发点,阶跃星辰研发出了新一代Step 3基础模型。

Step 3作为阶跃星辰的首个全尺寸、原生多模态推理模型,在模型架构创新和算法工程协同设计上实现了大胆突破。该模型采用MoE架构,总参数量达到321B,激活参数量为38B。在性能上,Step 3显著提升了视觉感知和复杂推理能力,能够准确完成跨领域的知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。

在多个权威榜单上,Step 3取得了开源多模态推理模型的顶尖成绩,包括MMMU、MathVision、SimpleVQA、AIME 2025以及LiveCodeBench等。在成本方面,Step 3在国产芯片上的推理效率表现出色,最高可达DeepSeek-R1的300%,且对所有芯片均表现出良好的兼容性。在基于NVIDIA Hopper架构的芯片上进行分布式推理时,Step 3的吞吐量相较于DeepSeek-R1提升了超过70%,且这一提升是在不牺牲激活参数量、不降低注意力容量的前提下实现的。

目前,Step 3已经授权给国内多家芯片公司,其中华为昇腾芯片已经成功搭载并运行Step 3。沐曦、天数智芯和燧原科技等公司也已初步实现Step 3的运行,其他厂商的适配工作也在紧锣密鼓地进行中。

除了发布Step 3模型外,阶跃星辰还宣布将与近10家芯片及基础设施厂商共同发起“模芯生态创新联盟”。这一联盟的成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程以及硅基流动等。联盟旨在打通芯片、模型和平台的全链路技术,推动整个生态系统的协同发展。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version