在AI领域的聚光灯下,阶跃星辰公司及其低调而坚定的CEO姜大昕近日成为了媒体关注的焦点。在一场于北京举行的媒体沟通会上,姜大昕分享了他对多模态人工智能(AI)发展的深刻见解,以及阶跃星辰在这条探索之路上的独特步伐。
姜大昕强调,多模态技术是实现通用人工智能(AGI)的关键路径。他指出,过去一年中,阶跃星辰虽未在融资或市场声量上大放异彩,却默默地在多模态领域深耕细作,发布了多达22款自研基座模型,其中16款为多模态模型,占比超过七成,这一成就让阶跃星辰在业内赢得了“多模态卷王”的称号。
与语言模型领域的技术路线已相对明确不同,多模态技术的探索仍处于迷雾之中。姜大昕表示,阶跃星辰押注的是“理解+生成一体”的原生多模方向,这一方向在技术演进上可能还处于GPT 1.0之前的阶段,即Transformer刚出现时的时期。阶跃星辰的技术路线尤为艰难,要求同一个大模型既要能理解,也要能生成,这构成了公司自成立以来的发展主线。
姜大昕进一步解释了多模态技术的难点和重要性。他提到,多模态的一大挑战在于融合过程中不能损失单个模态的性能,尤其是不能降智。阶跃星辰所追求的理解生成一体化,意味着模型能够理解画面中的物体关系,并通过生成端来监督;同时,生成的内容也需要理解来控制,以确保其符合物理世界的认知。他认为,多模态对于AGI至关重要,因为人的智能是多元化的,包括语言、视觉、空间等多种智能,这些智能需要通过多模态来进行学习。
在沟通会上,姜大昕还分享了对多模态领域未来发展趋势的看法。他认为,下一步的模型发展趋势包括在预训练的基础模型上加入强化学习,以提高模型的推理能力;以及将推理引入到多模态领域,实现模型的感知能力和内部知识的结合。他还强调了视觉领域的理解生成一体化的重要性,认为这是解决模型生成时非思维链问题的关键。
姜大昕还提到了DeepSeek等推理模型的进步对多模态技术探索的推动作用。他认为,DeepSeek的成功经验表明,传统的投流逻辑在AI时代可能不再适用。阶跃星辰也选择了一条不同于主流的道路,没有盲目追求流量,而是专注于基础大模型的研发,以及与行业头部公司的合作。
阶跃星辰已与Oppo、吉利汽车集团等企业展开深度合作,将Agent应用在汽车、手机等关键场景中。姜大昕表示,随着模型能力的不断增强,将有更多的应用被解锁和成熟。他特别提到了智能终端Agent的方向,认为Agent将更好地帮助人类完成任务,理解用户所处环境和任务的上下文,并有望从数字世界走向物理世界,延伸到智能驾驶和人形机器人等领域。
姜大昕还透露,阶跃星辰内部已经组织起不同技术路线的数支团队,以探索可能的技术突破。他认为,多模态领域的任何一个短板都可能延缓AGI的进程,因此阶跃星辰将继续在这条道路上坚定前行。
在沟通会的最后,姜大昕表达了对阶跃星辰未来的信心。他表示,尽管AI领域的技术发展日新月异,阶跃星辰将坚持基础大模型的研发,并与行业伙伴紧密合作,共同推动多模态技术的发展和应用。