滚动资讯

当前位置：首页 > 资讯 > 智能汽车 > 正文内容

阶跃星辰创始人谈AI未来：多模态模型如何铺就通往AGI之路？

时间：2025-05-08 23:28:10 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在AI领域，阶跃星辰以其惊人的速度和创新力，在短短两年内推出了16款多模态大模型，迅速在业界赢得了“多模态卷王”的称号。近日，阶跃星辰的创始人兼CEO姜大昕在接受采访时，深入分享了他对于AI未来的思考，尤其是多模态在通向通用人工智能（AGI）道路上的关键作用。

姜大昕强调，无论是从AGI的定义出发，还是从AI应用的实际需求来看，多模态能力都至关重要。他认为，AGI旨在模拟人类智能，这意味着它不仅要具备语言模态对应的符号智能，还需拥有视觉智能、空间智能、运动智能等。任何一个方向的短板，都可能阻碍AGI的实现。同样，从应用角度来看，智能系统只有具备了听、看、说等能力，才能真正理解用户环境，实现与用户的自然交互。

在AI技术演进的过程中，阶跃星辰始终认为，多模态是实现AGI的必经之路。姜大昕将AI技术的发展分为三个阶段：模仿学习、探索世界和归纳世界。在模仿学习阶段，模型从海量数据中学习多种模态的表征，统一表达多种模态是核心问题。探索世界阶段，模型需要复杂问题求解能力和慢思考能力，这些能力可以通过强化学习技术获得。归纳世界阶段，模型将逐渐具备自主学习能力，发现客观世界的规律。

阶跃星辰在多模态模型上的投入是显而易见的，他们几乎每个月都会发布一款基础大模型。例如，他们与Ace Studio联合开源的Ace-Step音乐大模型，参数量仅3.5B，却能支持19种语言，最快可在15秒内生成一首歌曲。他们发布的Step-R1-V-Mini多模推理模型，具备高精度感知能力，已在门店巡检、短剧审核等生产场景中得到了应用。

姜大昕特别提到了多模态理解生成一体化的技术路径。在语言层面，大语言模型已经能够完成理解与生成任务。然而，在多模态领域，由于图片、视频等模态的复杂度极高，理解生成一体化的难题尚待突破。姜大昕认为，生成需要理解控制，理解需要生成监督。目前，多模态模型仍处于“前Transformer”时期，尚未出现可拓展的模型架构。但阶跃星辰内部已有多个团队在探索这一方向，并开源了Step1X-Edit图像编辑模型，该模型已初步具备了一定的理解生成一体化能力。

在应用层面，阶跃星辰坚持超级模型+超级应用双轮驱动的策略。他们看到了智能终端Agent的潜力，认为多模态能力和慢思考能力使Agent能够感知环境、理解任务上下文，并处理复杂任务。目前，阶跃星辰的智能终端Agent已在手机、汽车、机器人等领域得到了应用。例如，OPPO手机上的“一键问屏”功能就使用了阶跃星辰的多模态模型，吉利的智能座舱则采用了他们的端到端语音交互技术。

对于AI的未来，姜大昕表示，阶跃星辰将继续坚持基础大模型的研发，追求AGI的初心不会改变。在当前的基础大模型格局中，阶跃星辰将多模态作为其差异化优势，积极探索多模态理解与生成一体化这一前沿方向。他们相信，这一领域存在着巨大的机会，将推动AI技术迈向新的高度。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

小米YU7汽车亮相：电动内翻门把手+UWB无感开锁，科技感十足！

05-22

小米YU7纯电SUV震撼登场，690PS马力，3.23s破百性能卓越

05-22

小米YU7新车亮相：宝石绿配色惊艳，双层色漆打造高级质感！

05-22

小米YU7亮相：环绕式“天际屏”打造1.1米超宽视觉盛宴！

05-22

小米15周年庆典：自研芯片大放异彩，YU7电动车7月来袭！

05-22

小米YU7车型亮相：双零重力座椅+后排电动调节，舒适体验再升级！

05-22

小米YU7内饰大揭秘：天际屏+6.68英寸后排屏，智能交互新体验！

05-22

小米YU7续航突破835km，中大型纯电SUV新标杆诞生！

05-22

小米YU7安全升级：2200Mpa超强钢防滚架，铠甲笼式车身守护出行安全

05-22

吉利雷达金刚EM-P电混皮卡，续航超千公里，下周震撼登场！

05-22

小米15周年发布会：YU7车型座舱智能化，骁龙8 Gen 3芯片助力如何？

05-22

房山智造深蓝S09今日上市，华为技术加持打造极致驾驶体验

05-22

小米YU7合金车模来袭！1:18比例，599元起售

05-22

小米发布YU7，雷军：同价位最美SUV，颜值爆表！

05-22

小米YU7正式发布：续航达835km，7月上市，能否撼动SUV市场？

05-22

点击查看更多 +

全站最新

小米YU7亮相：环绕式“天际屏”打造1.1米超宽视觉盛宴！

小米15周年庆典：自研芯片大放异彩，YU7电动车7月来袭！

AG600“鲲龙”首秀大兴安岭，两小时飞行展现水陆两栖灭火实力

小米15S Pro玄戒O1强势登场，15周年献礼，性能影像全面升级！

七彩虹BTF 3.0显卡新设计：本体仅GC-HPWR母口，子板供电灵活切换

小米YU7车型亮相：双零重力座椅+后排电动调节，舒适体验再升级！

热门内容

本栏最新

小米YU7正式发布：续航达835km，7月上市，能否撼动SUV市场？

丰田RAV4全面混动革新，第六代车型强势登场！

深蓝S09正式上市，23.99万起售，华为赋能能否赢得市场青睐？

江铃汽车双雄出击！全新域虎顺达上市，8.68万起售能否引爆市场？

福特F-150 Lobo谍照抢先看！内外动力全面革新，能否掀起皮卡新浪潮？

小米YU7定价揭晓？雷军：19万9不可能，7月上市见分晓

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.