滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

商汤科技推出SenseNova U1图文交错增强版模型助力多页连续内容创作升级

时间：2026-06-12 22:09:54 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

商汤科技近日宣布，其日日新SenseNova U1系列迎来全新成员——U1-8B-MoT-Interleaved图文交错增强版模型正式开源。该模型针对图文混合创作场景进行深度优化，重点解决了传统多模态模型在连续内容生成中存在的角色形象不一致、画面风格割裂、图文内容错位等核心问题，为绘本创作、故事书生成、多页PPT设计及图文教程制作等应用场景提供更高效的解决方案。

在技术升级层面，新模型通过四大核心突破实现性能跃升。首先，叙事连贯性得到质的提升，模型在长文本生成过程中可保持故事线严格统一，人物形象从首页到末页均呈现高度一致性，有效避免了传统模型因多轮生成导致的角色特征漂移问题。其次，图文语义对齐能力显著增强，经过专项训练的模型能够精准捕捉文字描述中的空间关系、动态动作及复杂场景细节，生成的图像与文本内容匹配度大幅提升。

针对视觉质量优化，研发团队对人物结构、文字渲染、版面布局等高频问题区域进行定向改进。通过引入新型损失函数与训练策略，模型生成的图像中常见的视觉瑕疵（如文字扭曲、肢体变形、排版错乱等）发生率降低超过60%，画面整体质量达到行业领先水平。特别在多页内容生成方面，新模型展现出独特的架构优势，能够自动识别输入文本的逻辑层次，智能完成要点提取、版面设计与文字排版。

据技术文档披露，该模型在训练阶段构建了包含百万级图文交错样本的专用数据集，采用渐进式训练策略逐步强化模型对连续叙事的理解能力。在多页PPT生成测试中，模型可自动将3000字左右的输入文本转化为包含15-20页的完整演示文档，其中图文布局合理度达到92%，关键信息覆盖率超过95%。这项突破性功能将极大缩短专业人士的文档制作周期，同时降低非专业用户的创作门槛。

行业分析师指出，此次开源的增强版模型标志着多模态生成技术从单页创作向长内容生成的范式转变。其特有的叙事保持机制与智能排版能力，不仅为教育出版、商业演示等领域提供新的技术工具，更可能催生图文创作领域的全新应用形态。随着模型代码与训练框架的全面开放，预计将吸引更多开发者参与生态共建，推动图文创作技术的持续进化。

06-12

湖北江城实验室突破电容关键技术助力AI GPU芯片实现高算力低功耗

06-12

哈啰严正声明反击失实报道：已报警维权，坚守合法合规初心

06-12

国产航天星闪技术破解通信难题：隧道矿井告别盲区，稳定联网成现实

06-12

"牛市旗手"再起舞，深市最大证券ETF天弘(159841)标的指数涨超3.6%，最新估值低于近十年99%历史时间

06-12

丰元股份：拟向特定对象发行A股股票募资不超14.28亿元

06-12

龙溪股份：股票异常波动一季度营收增10.59%净亏损24万元

06-12

川润股份：孙公司签署液冷系统关键零部件产业化建设项目投资协议

06-12

韩国券商一季度大赚4万亿韩元银行出手限制借钱炒股

06-12

ST长园：股东吴启权涉嫌挪用资金被刑事立案

06-12

交大昂立：控股股东上海韵简拟增持1%-2%股份

06-12

加拿大投资管理公司将推出在多伦多上市的SpaceX ETF

06-12

维珍银河盘前跌超10%

06-12

炬光科技：控股股东提前终止减持计划剩余5万股未减持

06-12

瑞泰新材：终止共同投资设立基金

06-12

点击查看更多 +

全站最新

小米汽车YU7实测续航亮眼，全系安全配置“一视同仁”无差别

红米K100系列配置大升级，大屏长续航强性能，或告别性价比定位？

泰和新材“5天4板”股价创新高业绩承压下如何谋转型突围？

90后技术天才陈宇森接棒钉钉CEO，AI新征程能否引领钉钉二次腾飞？

6·18大促百亿补贴“掺水” 五大电商平台遭监管约谈限期整改

淅川护林员陈人范：42年坚守水源地，用一生筑牢生态屏障荣膺“中国好人”

热门内容

本栏最新

北京地铁回应张雪事件：闸机防夹未关时插卡，无效票卡被退引误会

两年估值10.9亿订单爆满，张雪机车上市时机：是顺势而为还是再等等？

Ping64如何让即时通讯文件外发从“盲区”变“责任链”全解析

千诀科技A轮融资数亿元，京铭资本领投多家老股东持续加码共助发展

雨天刹车“失灵”？别急着怪自己，水膜作祟才是真凶！

亿达科创深圳新址启幕借湾区优势绘就数字服务发展新蓝图

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

商汤科技推出SenseNova U1图文交错增强版模型 助力多页连续内容创作升级

商汤科技推出SenseNova U1图文交错增强版模型助力多页连续内容创作升级