商汤科技：从视觉到多模态，如何跻身大模型竞争前列？

时间：2025-05-09 14:12:22 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

在人工智能领域，商汤科技这家成立仅十年的公司，正以其独特的视角和技术实力，在大模型竞赛中崭露头角。过去，商汤以计算机视觉技术见长，与当前以自然语言处理为主的大模型浪潮看似格格不入。然而，随着DeepSeek R1的发布，这一格局被彻底打破。

DeepSeek R1的出现，不仅让语言大模型的竞争更加激烈，也让商汤的技术实力得到了前所未有的展现。在ChatGPT之后，各大语言模型厂商纷纷投入巨资研发GPT-4的升级版，但DeepSeek R1的横空出世，几乎抹平了这些努力带来的差距。面对这一挑战，行业内的玩家面临两个选择：要么紧跟DeepSeek的步伐，继续提升语言大模型的性能，要么寻找差异化的竞争点。

值得注意的是，商汤并没有局限于语言大模型的竞争。根据权威研究机构EPOCH AI的调查，用于训练大语言模型的文本数据正在迅速接近危机点，预计到2028年，语言大模型的训练数据集将耗尽互联网的所有可用文本数量。与此同时，语言大模型也呈现出性能随参数规模加大而提升的边际效益递减趋势。因此，商汤将目光投向了多模态大模型，这一被视为迈向通用人工智能（AGI）的关键一步。

经过两年的努力，商汤成功推出了新一代6000亿参数的多模态大模型“日日新 Sense Nova V6”。这款模型在多模态综合能力上，不仅与GPT-4.5和Gemini 2.0 Pro相当，甚至在某些方面略有超越。更重要的是，商汤还引入了长思维链技术，将多模态与深度思考相结合，为模型增添了更强的推理能力。

商汤在多模态大模型领域的突破，并非一蹴而就。从2024年年中开始，商汤就开始探索原生融合的多模态大模型，并在今年1月10日，即DeepSeek R1发布并爆火前，就已经登上了SuperCLUE和OpenCompass两大权威榜单榜首，成为大语言与多模态能力的“双冠王”。这一成就，无疑证明了商汤在大模型领域的深厚底蕴和创新能力。

商汤的技术优势不仅体现在多模态大模型上，还体现在其大装置与商业积累的紧密协同上。商汤的大装置在算力上领先行业至少3年，为大模型的训练提供了强有力的支持。同时，商汤在过去十年中积累的商业化实战经验，也为其在大模型市场的竞争中提供了独特的优势。这使得商汤在推出日日新V6后，能够迅速将其应用于各行各业，推动AI技术的落地和应用。

在日日新V6的推动下，商汤的多模态大模型已经能够在数学解题、点读翻译、文旅讲解、绘本讲解等日常高频需求的响应中，取得相较于以往多模态模型更出色的性能表现。同时，商汤还与傅利叶等机器人厂商合作，探索了V6与终端结合的可能性，为具身智能的发展提供了新的思路。

商汤在办公领域也取得了显著的进展。其小浣熊系列产品，借助V6的多模态深度思考与推理能力，实现了任务规划、数据分析、文档编辑等能力的大幅提升。这不仅提升了办公效率，还为AI技术在办公领域的应用提供了新的可能。

在商业化方面，商汤的表现同样亮眼。根据2024年的财报，商汤生成式AI的业务收入达到24亿元，在总收入中的占比高达63.7%，同比涨幅超过100%。这一成绩，不仅证明了商汤在大模型领域的商业潜力，也为其未来的发展奠定了坚实的基础。

商汤并没有局限于To C市场的竞争，而是更加注重To B市场的拓展。从构建人工智能时代的“终局思维”来看，推动更多行业、更多需求转向“AI-Native”对商汤来说比加大投入追求SuperApp更有价值。因此，商汤将日日新大模型系列广泛应用于WPS、阅文、想法流等多个明星C端应用的同时，也积极拓展B端业务，为更多行业提供AI技术解决方案。

在算力、算法、用户与商业这一完整的模型体系中，商汤凭借其大装置与商业积累的优势，成功启动了飞轮效应。随着日日新V6的发布，商汤多模态大模型的实力得到了极大提升，算法飞轮也展现出了巨大的潜力。未来，商汤将继续深耕大模型领域，推动AI技术的创新与应用，为人工智能时代的发展贡献更多力量。

IT之家 6 月 15 日消息，IT之家从百度微信公众号获悉，昨天百度在百度园区里举办 AIDU 计划・DeepTalk 开放日。今年的AIDU 计划，是百度最大规模的顶尖 AI 人才招聘。百度方面介绍，…

从当前提供的信息来看，MI350系列延续了MI300时代的模块化封装与堆叠设计思路，但在芯粒数量、互联方式、缓存架构以及张量计算能力等方面均有所优化，特别是在FP4与FP6浮点计算性能上的提升，成为AMD本…

快科技6月13日消息，对于AI人工智能发展，黄仁勋表示，大家不用担心会失业。Anthropic首席执行官达里奥阿莫代伊近日警告称，AI有可能让多达一半的初级白领岗位消失，Z世代将面临前所未有的就业危机。不…

2025年芯片厂商发布的新款次旗舰SoC已经具备了流畅运行端侧大模型的能力，Deepseek的出现也在很大程度上降低了大模型对于芯片算力的开销，在这两大因素的共同作用下，2025-2026年AI手机仍预计会保…

在全模态、系统化完整交付能力上，在输入端，百度文库、网盘拥有文字、语音、图片、视频等全模态、全格式输入能力，全天候、全方位接受并响应用户需求；在处理端，百度文库、百度网盘联合推出的内容操作系统「沧舟OS」，…

GenFlow超能搭子2.0体现了百度文库在全模态处理、输出上的领先能力，使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。目前，百度文库、百度网盘在AI内容创作、内容消费、个人知识库等领域已达行业…

GenFlow超能搭子2.0体现了百度文库在全模态处理、输出上的领先能力，使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。截止目前，百度文库AI MAU已达9700万，拥有14亿专业内容资源；在最新…

据悉，基于AI技术，该系统首次实现从芯片硬件到基础软件的全流程无人化设计，其产出方案在性能、能效等关键指标上均达到人类专家水平。随着AI、自动驾驶等场景对定制化芯片需求爆发，芯片设计人才短缺的问题日益凸显，而…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.