ITBear旗下自媒体矩阵:

商汤科技:从视觉到多模态,如何跻身大模型竞争前列?

   时间:2025-05-09 14:12:22 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在人工智能领域,商汤科技这家成立仅十年的公司,正以其独特的视角和技术实力,在大模型竞赛中崭露头角。过去,商汤以计算机视觉技术见长,与当前以自然语言处理为主的大模型浪潮看似格格不入。然而,随着DeepSeek R1的发布,这一格局被彻底打破。

DeepSeek R1的出现,不仅让语言大模型的竞争更加激烈,也让商汤的技术实力得到了前所未有的展现。在ChatGPT之后,各大语言模型厂商纷纷投入巨资研发GPT-4的升级版,但DeepSeek R1的横空出世,几乎抹平了这些努力带来的差距。面对这一挑战,行业内的玩家面临两个选择:要么紧跟DeepSeek的步伐,继续提升语言大模型的性能,要么寻找差异化的竞争点。

值得注意的是,商汤并没有局限于语言大模型的竞争。根据权威研究机构EPOCH AI的调查,用于训练大语言模型的文本数据正在迅速接近危机点,预计到2028年,语言大模型的训练数据集将耗尽互联网的所有可用文本数量。与此同时,语言大模型也呈现出性能随参数规模加大而提升的边际效益递减趋势。因此,商汤将目光投向了多模态大模型,这一被视为迈向通用人工智能(AGI)的关键一步。

经过两年的努力,商汤成功推出了新一代6000亿参数的多模态大模型“日日新 Sense Nova V6”。这款模型在多模态综合能力上,不仅与GPT-4.5和Gemini 2.0 Pro相当,甚至在某些方面略有超越。更重要的是,商汤还引入了长思维链技术,将多模态与深度思考相结合,为模型增添了更强的推理能力。

商汤在多模态大模型领域的突破,并非一蹴而就。从2024年年中开始,商汤就开始探索原生融合的多模态大模型,并在今年1月10日,即DeepSeek R1发布并爆火前,就已经登上了SuperCLUE和OpenCompass两大权威榜单榜首,成为大语言与多模态能力的“双冠王”。这一成就,无疑证明了商汤在大模型领域的深厚底蕴和创新能力。

商汤的技术优势不仅体现在多模态大模型上,还体现在其大装置与商业积累的紧密协同上。商汤的大装置在算力上领先行业至少3年,为大模型的训练提供了强有力的支持。同时,商汤在过去十年中积累的商业化实战经验,也为其在大模型市场的竞争中提供了独特的优势。这使得商汤在推出日日新V6后,能够迅速将其应用于各行各业,推动AI技术的落地和应用。

在日日新V6的推动下,商汤的多模态大模型已经能够在数学解题、点读翻译、文旅讲解、绘本讲解等日常高频需求的响应中,取得相较于以往多模态模型更出色的性能表现。同时,商汤还与傅利叶等机器人厂商合作,探索了V6与终端结合的可能性,为具身智能的发展提供了新的思路。

商汤在办公领域也取得了显著的进展。其小浣熊系列产品,借助V6的多模态深度思考与推理能力,实现了任务规划、数据分析、文档编辑等能力的大幅提升。这不仅提升了办公效率,还为AI技术在办公领域的应用提供了新的可能。

在商业化方面,商汤的表现同样亮眼。根据2024年的财报,商汤生成式AI的业务收入达到24亿元,在总收入中的占比高达63.7%,同比涨幅超过100%。这一成绩,不仅证明了商汤在大模型领域的商业潜力,也为其未来的发展奠定了坚实的基础。

商汤并没有局限于To C市场的竞争,而是更加注重To B市场的拓展。从构建人工智能时代的“终局思维”来看,推动更多行业、更多需求转向“AI-Native”对商汤来说比加大投入追求SuperApp更有价值。因此,商汤将日日新大模型系列广泛应用于WPS、阅文、想法流等多个明星C端应用的同时,也积极拓展B端业务,为更多行业提供AI技术解决方案。

在算力、算法、用户与商业这一完整的模型体系中,商汤凭借其大装置与商业积累的优势,成功启动了飞轮效应。随着日日新V6的发布,商汤多模态大模型的实力得到了极大提升,算法飞轮也展现出了巨大的潜力。未来,商汤将继续深耕大模型领域,推动AI技术的创新与应用,为人工智能时代的发展贡献更多力量。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version