ITBear旗下自媒体矩阵:

商汤科技再发力!开源“日日新SenseNova U1”模型,引领AI原生多模态新潮流

   时间:2026-04-29 08:02:58 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

商汤科技近日宣布,其自主研发的“日日新SenseNova U1”原生理解生成统一模型正式开源。这一创新架构突破了传统多模态模型的设计局限,首次在单一模型中实现了视觉与语言理解的深度融合,标志着人工智能领域从“模态拼接”向“原生统一”的技术范式转变。

该模型基于商汤今年推出的NEO-unify架构,通过构建统一的表征空间,彻底摒弃了视觉编码器与语言模块的拼接式设计。这种创新使得模型能够直接处理图像与文本的复合信息,在保持语义完整性的同时,实现了像素级的视觉还原能力。实验数据显示,其轻量版SenseNova U1 Lite在图像生成、视觉推理等基准测试中,已达到同量级开源模型的顶尖水平,部分性能甚至超越大型商业闭源模型。

在效率层面,统一架构展现出显著优势。传统多模态模型如同“接力式”信息处理,各模块间存在数据损耗与延迟;而SenseNova U1则像“全能处理器”,在同一神经网络中完成多模态信息的同步处理。这种设计使80亿参数的轻量版模型在通用图像生成任务中,推理速度较同类模型提升30%以上,同时在复杂信息图生成等高难度任务中展现出商业级表现。

该模型在连续性创作领域实现突破性应用。通过保留图文融合信号的上下文关联,SenseNova U1成为首个支持单模型调用完成连贯图文创作的系统。在演示案例中,模型可自主规划“五分熟牛排烹饪流程”,并为每个步骤生成风格统一的配图;在“钢铁侠图案绘制”任务中,能从简单草稿逐步生成完整图像,每步创作都精准延续前序结构细节。这种能力为智能教育、创意设计等领域开辟了新的应用场景。

商汤同步开源了SenseNova U1 Lite的两个变体模型:基于稠密网络的8B-MoT版本和采用混合专家架构的A3B-MoT版本。相关代码与预训练模型已上线国际开源平台,开发人员可自由获取使用。技术团队透露,后续将沿着高效架构路径持续迭代,计划推出参数规模更大的版本,力争以更低计算成本达到国际领先水平。

行业专家指出,原生统一架构通过消除模态间的处理壁垒,为多模态大模型发展提供了新思路。其开源将加速技术普惠,推动AI在复杂场景中的落地应用。特别是连续创作能力的突破,解决了传统模型在长序列任务中的上下文断裂问题,为构建更智能的人机协作系统奠定基础。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version