ITBear旗下自媒体矩阵:

多模态大模型崛起:华泰证券预测应用奇点即将到来

   时间:2025-07-13 05:10:04 来源:数策孤岛编辑:快讯团队 IP:北京 发表评论无障碍通道

近期,华泰证券发布了一份深度研究报告,聚焦于多模态大模型及其应用的迅猛发展,指出该领域正迅速接近一个关键转折点。

报告详细分析了多模态大模型的发展动态,强调这是大语言模型(LLM)演进的必然趋势。尽管LLM在文本处理方面表现出众,但为了拓宽应用场景,研究者正积极将其他模态能力融入,从而催生了多模态大型语言模型(MLLM)。MLLM主要分为模块化架构与原生架构两类,其中原生架构因能在全模态数据上同步训练,展现出在性能和效率上的显著优势,不过对算力和技术要求也更为严苛。目前,以OpenAI和Google为代表的行业巨头在这一领域处于领先地位。

从商业化角度来看,全球范围内多模态应用的进展呈现出海外快于国内、一级市场公司快于二级市场公司、多模态产品快于文本产品的趋势。海外Chatbot类产品,如OpenAI和Anthropic,已经实现了超过10亿美元的年化收入(ARR),相比之下,国内Chatbot的商业化进程尚显稚嫩。然而,国内年收入超过1亿美元的AI公司大多聚焦于多模态产品,如美图、快手和睿琪软件等。

特别是在视频生成领域,国内企业表现出色。字节的Seedance 1.0、快手的可灵(Kling)以及MiniMax Hailuo 02等产品,在文生视频、图生视频等多个榜单中名列前茅。以快手可灵为例,该产品上线仅约10个月,ARR就突破了1亿美元大关,标志着国内视频生成领域实现了从单点突破到多点突破的跨越。

多模态产品持续迭代升级,图像生成从追求高质量逐渐转向提升易用性,视频生成则在时长、清晰度和一致性等方面不断取得突破。同时,语音、音乐、3D等领域的产品也在积极拓展应用场景。原生多模态模型的普及与Agent形态的落地,进一步推动了算力需求的增长,而应用侧在广告、零售、创作等领域的AI化需求也在持续释放。

报告中还提到,随着技术的不断迭代和商业化落地的加速,多模态大模型正逐渐成为行业的核心发展方向。图像、视频、语音等多模态数据的融合处理,将极大地拓宽AI的应用场景,推动其在更多领域实现规模化应用。

华泰证券的这份报告,不仅为行业提供了关于多模态大模型及其应用的最新洞察,也为相关企业和投资者指明了未来的发展方向。可以预见,随着技术的不断进步和应用场景的不断拓展,多模态大模型将在更多领域发挥重要作用。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version