从语言到世界：商汤林达华谈AI新范式与原生多模态的突破之路

时间：2025-12-18 04:28:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

商汤科技最新发布的原生多模态模型SenseNova-SI，在空间智能领域实现重大突破，其性能指标全面超越李飞飞团队研发的Cambrian-S模型。这款由商汤自主研发的开源模型，在多个空间智能基准测试中刷新纪录，成为当前性能最优的开源解决方案。该成果标志着中国科技企业在AI技术底层架构创新方面迈出关键一步。

在量子位与商汤科技首席科学家林达华的深度对话中，他指出当前AI发展正面临范式转折点。自2022年ChatGPT引发的参数竞赛以来，单纯依赖模型规模扩张的路径已显露出明显瓶颈。尽管大语言模型在文本处理领域持续突破，但在三维空间认知、物理世界交互等核心能力上仍存在显著缺陷。这种局限性在最新测试中暴露无遗：当被要求识别图像中手指数量时，传统多模态模型仍会机械性输出"5根"的标准答案，完全忽视实际图像中的真实数量。

商汤团队通过架构创新破解这一难题。其研发的NEO架构采用原生多模态设计，从底层Transformer模块开始实现视觉与语言信号的深度融合。区别于传统拼接式架构将视觉编码与语言处理分离的模式，NEO架构通过混合注意力机制，使模型在每层推理中同步处理图文信息。这种设计使模型能够保留原始视觉特征的完整信息，避免传统架构中因信号降维导致的空间认知损失。

技术突破带来显著效率提升。SenseNova-SI模型仅使用同类模型10%的训练数据，便在空间推理、三维建模等关键指标上达到领先水平。测试数据显示，该模型在跨视角物体识别任务中准确率提升37%，在复杂场景理解任务中错误率降低42%。更值得关注的是，模型展现出类似人类的"空间想象力"——当输入物体正面图像时，能够准确预测其侧面结构特征，这种能力在自动驾驶、机器人导航等领域具有重要应用价值。

在技术落地方面，商汤团队展现出独特的工程优化能力。以实时语音驱动数字人产品SekoTalk为例，通过算法蒸馏技术将传统扩散模型的推理步骤从100步压缩至4步，实现64倍速度提升。这项突破使得消费级显卡即可支持实时视频生成，将AI应用成本降低两个数量级。据测试，使用RTX 4090显卡可同时驱动8个数字人进行实时互动，为直播电商、在线教育等领域开辟新的商业模式。

林达华特别强调工业红线标准："任何AI技术必须通过成本效益测试，当推理成本实现每年1-2个数量级下降时，才能从实验室走向规模化应用。"这种务实理念贯穿商汤的技术研发全链条。在模型训练阶段，团队通过动态数据筛选机制，将有效训练数据占比从行业平均的15%提升至63%；在部署环节，采用自适应量化技术使模型内存占用减少78%，推理延迟降低54%。

针对AI从业者的职业发展，林达华给出建议：当前大语言模型赛道竞争过度，年轻研究者应关注具身智能、科学计算、工业制造等新兴领域。他特别指出，中国拥有全球最完整的工业体系和最丰富的应用场景，这种独特优势为发展物理世界交互型AI提供了得天独厚的条件。商汤最新开源的NEO架构和SenseNova-SI模型，已为全球开发者提供完整的底层框架和训练工具，相关代码已在GitHub平台公开。

作为一款四足机器人，途途不仅能出门、会思考，更能作为智能导盲犬守护视障人士，是全球首款可在开放环境下全自主行动的具身机器人。其中，开放环境下的导盲服务，是考验机器人综合能力的最复杂场景，这并非在实验室里走直线…

在机器人领域，VLA就类似于M1之前的笔记本电脑架构——视觉模块、语言模块、动作模块各自为政，数据在模块之间搬来搬去，每搬一次就丢一次信息。在机器人领域，VLA就类似于M1之前的笔记本电脑架构——视觉模块、语…

面对AI与地空互联等技术加速普及、医疗服务向家庭延伸等趋势，聚合物生产商科思创以“材料效应”为主题，呈现其在飞行汽车、人形机器人、数据中心及医疗可穿戴等前沿领域的创新材料解决方案，回应材料科学如何支撑下一代技…

极目新闻记者黄永进4月19日亦庄机器人马拉松，荣耀机器人闪电首次参赛就打破人类半马纪录，令人无比惊叹的表现让人重新认识到，做手机的荣耀正在快速向“最酷的AI生态公司”进化。回头看并非偶然——荣耀青海湖刀…

IT之家 4 月 22 日消息，OpenAI 今天（4 月 22 日）发布 ChatGPT Images 2.0 生图工具外，其偷跑的GPT-5.5 模型迅速成为网友热议焦点。根据部分网友反馈，在 Code…

IT之家 4 月 22 日消息，彭博社昨日（4 月 21 日）发布博文，报道称在接棒掌舵苹果公司之前，约翰 · 特努斯（JohnTernus）已着手推动内部改革，开始利用人工智能重塑公司内部运营。消息称特…

面向 Agent 场景进行定向增强：针对当前需求最旺盛的 Agent 应用，在工具调用、多步规划与任务执行能力上持续打磨，使模型在BFCL-V4、TAU2-bench、SWE-bench Verified…

针对黄浦区的实际环境，通过科学的规划实施黄浦超融合部署，能够显著降低物理机柜占用率。据 IDC关于超融合架构市场的分析数据显示，相比传统分散式架构，超融合解决方案在同等配置下可节省约 40% 的空间占地与能…

在这一背景下，6G需要支持智能体之间的直接连接、网络侧调度以及边缘协同决策，无线接入网也将向多基站协同服务智能体集群演进。邬贺铨表示，6G标准化仍在推进过程中，坚持务实导向，在性能、成本与应用之间取得平衡…

当前制造业对精密零部件的需求呈现出突出特征：航空航天领域要求严苛的公差控制，医疗器械行业需要符合国际标准的加工质量，5G通信设备对高频信号传输组件提出极高的尺寸稳定性要求。在加工精度方面，劲希精密通过持续…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.