ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

字节跳动Seedance 1.5 pro模型发布：多语种支持音画同步再升级

时间：2025-12-17 03:41:31 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

字节跳动近日正式推出全新一代音视频生成模型Seedance 1.5 pro，这款模型突破了传统生成式技术的局限，首次实现从文本或图像输入到带同步音频视频的完整创作流程。该技术通过深度整合音视频生成模块，在保持内容连贯性的同时，能够精准控制语音与画面的时空同步关系。

在语音生成维度，模型支持中、英、日等主流语言，并特别强化了方言语音的拟真度。研发团队通过构建多维度声学特征库，使系统能够模拟四川话的抑扬顿挫和粤语的九声六调，甚至能捕捉不同地域的语调起伏特征。针对影视创作需求，模型还优化了情感语音合成技术，可根据文本情境自动调整语速、重音和停顿节奏。

画面生成方面，该模型引入智能运镜算法，突破传统固定视角限制。通过分析文本中的空间关系和叙事节奏，系统可自主规划镜头运动轨迹，实现长镜头跟随、动态变焦等专业拍摄效果。在测试案例中，模型成功生成了包含多人物互动的复杂场景，通过动态调整景深和焦点位置，营造出电影级的视觉层次感。

技术架构上，研发团队采用改进型MMDiT框架，构建了多阶段数据优化链路。在预处理阶段，系统将输入文本解析为时空语义单元；生成阶段通过强化学习机制动态调整音视频参数；后处理环节则运用物理引擎进行运动合理性校验。这种分层优化策略使模型在人物口型匹配度、背景音效空间定位等指标上达到行业领先水平。

实际应用测试显示，该模型在广告制作、短视频创作等领域展现出显著优势。某影视公司试用后反馈，模型生成的宣传片在人物表情自然度、场景转换流畅性方面接近专业水准，但处理高速运动物体时仍存在形变问题。研发团队透露，后续版本将重点优化多角色交互场景的物理引擎，并计划开放部分参数接口供创作者微调。

【环球网科技综合报道】3月24日消息，据多家外媒报道，三星移动业务执行副总裁JayKim透露，三星将于“今年晚些时候”推出首款搭载Android XR系统的智能眼镜Galaxy Glasses，与同期发布…

03-25

特斯拉Terafab芯片项目来袭：资本支出或飙升，千亿级投资布局未来算力

特斯拉正全力推进其Terafab芯片项目，但这一计划可能使其资本支出规模远超此前预期。但马斯克认为，长期来看，Terafab将使特斯拉在AI竞赛中占据主导地位，“全球AI算力年产出仅20吉瓦，而我们需要的是它…

03-25

阿里达摩院发布玄铁C950处理器：5nm制程 3.2GHz频率单核性能创新高

PChome 3月24日消息，阿里达摩院召开2026玄铁RISC-V生态大会，正式发布新一代旗舰处理器玄铁C950。官方资料显示，玄铁C950历时两年研发，采用5nm制程，频率达3.2GHz，单核性能首次突…

03-25

苹果WWDC26亮点抢先看：iOS 27专注性能提升，Siri对标ChatGPT迎大升级

外观方面，由于 iOS 26 和 macOS 26 Tahoe 已引入“液态玻璃（Liquid Glass）”设计语言，因此在 iOS 27和 macOS 27 系统上，苹果将不再大幅改动视觉，而是将重心…

03-25

苹果WWDC2026定档6月，AI重大进展引领全平台系统革新

据科技媒体9to5mac报道，与往年侧重软件生态升级不同，苹果在公告中明确提及，本届WWDC将聚焦AI技术突破，包括更智能的Siri交互、情境感知能力提升及屏幕内容理解等。其中，iOS 27被普遍预期为AI…

03-25

AI自动化新突破：Anthropic为Claude添电脑操控功能，开启智能办公新篇章

智东西3月24日消息，今早，Anthropic为Claude发布了计算机使用（ComputerUse）功能，Claude可以自动操控电脑执行任务。上周，Claude Cowork中集成了一项新功能Dis…

03-25

硅谷150人创企Luma AI推Uni-1模型，性能比肩谷歌，价格优势或重塑图像生成格局

Reddit上一位进行了逐项对比测试的用户给出了更细致的评价：Nano Banana2在速度和文字渲染上仍有优势，但在“真正的逻辑推理、复杂场景理解和需要深度思考的编辑任务”上，Uni-1略胜一筹。从Un…

03-25

小屏旗舰新选择：一加15T手感续航双在线，影像短板仍需考量

说得再直接一点，在现有电池技术下，手机内部空间就这么大：你要性能，要续航，还想塞点影像，连苹果也只能老老实实把尺寸往上加。前面也说过了，想要水桶买小米，想要影像买 vivo，我们一加 15T 在拍照方面，…

03-25

三星Galaxy Glasses智能眼镜今年晚些时候登场，携手XR头显打造XR生态

03-25

阿里国际海外上线Accio Work：AI智能体助力，30分钟“手搓”网店不是梦

IT之家 3 月 24 日消息，阿里国际宣布正式在海外上线首个企业级 AI 智能体 AccioWork，号称可以“自主帮人做生意”，并透露目前平台企业用户数已超 1000 万。据介绍，Accio Work…

03-25

一加15T重磅登场：6.32英寸小屏集大成，性能续航双巅峰引领新潮流

3月24日，一加正式推出全新小屏旗舰——一加 15T，一加 15T搭载第五代骁龙8至尊版移动平台，配合LPDDR5X+UFS 4.1存储组合，同时配备新一代「风驰游戏内核」与165Hz高刷小屏，内置7500m…

03-25

25美元换屏让老ThinkPad焕新颜色彩可视度提升肉眼可见

快科技3月24日消息，对于一台2012年发布的笔记本电脑来说，最简单有效的升级方式是什么，博主onionboots给出了一个答案：花25美元（约172元人民币）换一块IPS屏幕。更高规格的1080P屏幕虽然…

03-25

小米卢伟冰谈内存涨价：挑战虽大但有应对之策，未来不排除产品涨价

IT之家 3 月 24 日消息，据人民财讯报道，在今日的业绩会上，小米集团负责人卢伟冰表示，这一轮内存上涨的速度、力度比公司原来想象得要高，对小米经营是一个很大挑战。同时，手机越高端，影响也会越小。虽然压力很…

03-25

苹果手机充电宝怎么选？10款安全又高效的充电宝推荐，便携快充两不误

许多便宜的充电宝在快充和便携性上做得相当不错，但其中的传统软包电池却存在较大隐患，软包电池在长期使用中容易因高温、过充等因素出现膨胀、漏液，甚至引发起火、爆炸等安全事故。品胜这款 TP-D256 属于大容量…

03-25

2026安卓快充充电宝怎么选？5款QC3.0实测好物，通勤差旅续航无忧

日常通勤、差旅出行时，充电宝早已成为安卓手机用户的必备品，但不少人都曾被这些问题困扰：普通充电宝充电速度缓慢，给骁龙8系、天玑9300等旗舰机型补电，动辄需要3-4小时，赶时间时根本无法满足需求；部分产品协…

03-25

点击查看更多 +

全站最新

美股三大指数集体收跌，纳指跌0.84%，赛富时跌超6%

小屏也能“大”作为：一加15T性能续航双在线，重塑小屏旗舰新标杆

小米CFO林世伟透露：新一代SU7订单火爆，女性及iPhone用户占比亮眼

小米汽车外观专利迎首战！燕鲁新能源提请3项无效，背后意图何在？

小米2025年创新业务收入破千亿汽车交付大增明年进军欧洲市场计划不变

华为尚界Z7系列来袭！22.98万起售，与小米SU7正面交锋谁能胜？

热门内容

本栏最新

小米CFO林世伟透露：新一代SU7订单火爆，女性及iPhone用户占比亮眼

小米汽车外观专利迎首战！燕鲁新能源提请3项无效，背后意图何在？

小米2025年创新业务收入破千亿汽车交付大增明年进军欧洲市场计划不变

华为尚界Z7系列来袭！22.98万起售，与小米SU7正面交锋谁能胜？

雷军“60+60=120”引争议，物理知识大讨论，SU7发布会意外成科普现场

华为尚界Z7入局纯电轿跑市场，新SU7迎劲敌，车圈“战火”升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

字节跳动Seedance 1.5 pro模型发布：多语种支持 音画同步再升级

字节跳动Seedance 1.5 pro模型发布：多语种支持音画同步再升级