ITBear旗下自媒体矩阵:

阶跃Step 3:多模态推理模型的新标杆,好用且高效

   时间:2025-07-27 21:26:37 来源:量子位编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在今年的世界人工智能大会(WAIC)上,推理模型和具身智能无疑成为了万众瞩目的焦点。各大厂商纷纷亮出自家的最新成果,试图在这个领域站稳脚跟。然而,在琳琅满目的展品和纷繁复杂的性能指标中,一个关键问题悄然浮现:什么样的推理模型,才能真正称得上是好用?

对于这个问题,或许可以从阶跃星辰在WAIC期间发布的新一代基础大模型Step 3中找到答案。Step 3,一个总参数达到321B的MoE模型,不仅具备强大的多模态推理能力,更重要的是,它将于7月31日正式开源。这一举动,无疑打破了市场上“强模型不开源,开源模型不强”的僵局。

Step 3的多模态能力,是其最引人注目的特点之一。作为一个视觉语言模型(VLM),它拥有独立的视觉编码器和语言模型,能够准确完成日常生活中的各类视觉分析问题。比如,只需报上身高体重,再给它一张商场中某品牌裤子的标签,它就能分析出你是否能穿。这种能力,在实际应用场景中无疑具有巨大的价值。

然而,Step 3的魅力远不止于此。阶跃星辰创始人、CEO姜大昕表示,模型不仅要知识丰富、善解人意,还要具备严谨的逻辑推理能力。这一点,在Step 3身上得到了充分的体现。给它一张没有任何文字信息的WAIC现场实拍图,它一眼就能看出吃瓜群众围得里三层外三层是为了看什么,甚至还能根据场馆布置特色和风格推测出这是发生在WAIC上的一幕。

除了强大的推理能力,Step 3还非常注重效率和成本。它通过系统协同设计(Model-system Co-design)提升了解码效率并降低了推理成本。其中,AFD分布式推理系统和MFA注意力机制是两大关键创新。这些创新使得Step 3在保持高性能的同时,还能在国产芯片上实现高性价比的推理。实验结果表明,在A800上,Step 3的成本低于所有同类模型;在H20上,其成本更是仅有DeepSeek-V3的30%。

为了让Step 3更好地落地应用,阶跃星辰还联合了近10家芯片及基础设施厂商发起了“模芯生态创新联盟”。这个联盟打通了芯片、模型、Infra完整技术链路,旨在提升模型适配性和算力应用效率。目前,华为昇腾、沐曦、壁仞科技等多家厂商已经实现了Step 3的搭载和运行。

在应用落地方面,阶跃星辰同样表现出色。尤其是在终端智能Agent方向,阶跃已经形成清晰的落地节奏,并获得了汽车、手机、具身智能、IoT等领域的客户的广泛认可。在WAIC的展台上,搭载了阶跃多模态模型能力的下一代智能座舱和吉利银河M9等展品吸引了大量观众围观体验。

Step 3的发布,不仅展示了阶跃星辰在推理模型领域的强大实力,更为整个AI产业带来了新的活力和机遇。它用自己的实际行动诠释了什么是真正好用的推理模型:多模态、推理强、用得起、还开源。这样的模型,无疑将成为开发者和企业长久追寻的刚需之选。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version