滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

先理解再动手！字节开源统一框架 Bernini，让 AI 视频编辑告别“碰运气”

时间：2026-06-03 23:03:28 来源：CHINAZ编辑：快讯 IP：北京 发表评论无障碍通道

AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——Bernini。该框架核心主打“先理解、再生成”的协同机制，旨在解决传统模型因无法精准理解复杂文本指令而导致画面失控、帧间闪烁等行业痛点。

传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局，Bernini巧妙地将工作流拆分为“语义规划”与“视觉渲染”两部分。系统首先通过多模态大模型规划器（MLLM-based planner）深度解析文本、视频及参考图像等输入素材，在特征空间中预测出目标语义表示，即勾勒出一张不限定像素的“语义草图”;随后，再由基于 Diffusion Transformer 的渲染器(DiT-based renderer)进行高质量视觉渲染，将规划好的语义目标转化为稳定、连续的视频画面。

得益于这一分工，Bernini在可控编辑上展现出了极高的实用价值。用户不仅能通过一条指令让画面中的天气、季节、材质和视觉风格发生逼真自然的变化，还能实现对镜头视角、焦点以及主体动作的精准语义控制。例如，在保持环境与镜头高度稳定的前提下，系统可让视频中的动物动作发生自然改变，让 AI 视频编辑更接近传统后期软件的精准度。

除了文本操控，Bernini还支持图片和视频作为视觉参考，大幅提升了创作的一致性。在视频编辑场景中，它可以将特定材质、指定主体甚至广告海报与视频素材精准植入目标区域，确保边界不破、透视不乱;而在新视频生成场景中，该模型支持单图参考生成、多角度参考生成、关键帧到连续镜头的演变，甚至能将几个八竿子打不着的单品图像完美组合到同一个视频角色身上。

为了解决多视觉片段串联时模型容易认混的难题，团队还引入了 SA-3D RoPE 位置编码机制，赋予不同视觉片段专属标记，从而在保留时空位置关系的同时分清参考素材与输出目标。目前，在字节自建的测试中，该框架已稳居行业第一梯队。据悉，Bernini的推理代码与第二阶段模型 Bernini-R 权限已正式放开，包含完整 MLLM 规划器的全版本也将在近期迎来全面开放。

更多>同类资讯

智元第15000台具身机器人下线具身智能产业开启规模化商业部署新篇

不到3个月前，智元刚刚在这片量产基地庆祝了第10000台机器人的下线；仅90天后，这一数字便被刷新到了15000台，再次创下全球具身智能机器人量产规模与速度的新纪录。从3年前实验室里“形单影只”的6台原型…

06-29

360发布“图龙锋”“仪天阵” 助力政企单位掌握AI时代安全主动权

面对AI自动化攻击带来的新挑战，360现场披露漏洞挖掘智能体“图龙锋”和网络安全自动化防御系统“仪天阵”，以智能体蜂群路线帮助政企单位掌握安全主动权。大会现场，360正式展示漏洞挖掘智能体“图龙锋”，它是3…

06-29

VR跑步机Omni One牵手Meta Quest：原生支持开启沉浸运动新体验

IT之家 6 月 28 日消息，制造商 Virtuix 宣布正式为旗下消费级 VR 跑步机 Omni One 引入原生 Meta Quest头显支持，产品同步加入 Meta 官方“Made for Meta…

06-29

红米Note17系列来袭，超大杯或配万级电池，千元机市场要变天？

红米Note17系列正式入网，发布时间暂定2026年7月份，其中超大杯有望改名Note17 ProMax，同时它也是小米首款电池容量过万的机型。红米Note17 Pro Max属于它的竞品，理智分析的话天玑…

06-29

iOS 27 Beta 2现百度视觉搜索组件，AI升级与折叠屏布局成新亮点

据悉，在这次的iOS 27升级中，苹果带来了AI方面的全新功能。根据官方数据，升级iOS 27后，iPhone和iPadApp的打开速度最高提升30%，新照片的显示速度最高提升70%，且iPhone 1…

06-29

红米REDMI K90至尊版6月30日登场：165Hz高刷直屏，游戏体验全面升级

红米全新预热的REDMI K90 至尊版，锁定在6月30日全新登场，以性能机市场为主，配置同为旗舰级，与同系列版本相近。续航方面，与Max版本相近，同为8550mAh大电池，硅含量已提升到16%，电池自然…

06-29

小米REDMI 17C新机来袭：护眼大屏搭配超级岛，入门价位享旗舰美学体验

随着屏幕设计不断演变，类型同步丰富，比如单孔、多孔、灵动岛等，主要是融入各大硬件，确保整体功能使用。新机核心在屏幕、机身、功能上，与常规入门机相近，不以性能为主，更多是体验方面。护眼大屏为6.88英寸，分辨…

06-29

小米YU7年销24.4万辆月均2.03万，细分赛道称王，离全民神车还有多远？

综合对比赛道竞品、产品周期、市场需求，小米YU7属于25万级现象级爆款SUV，是小米汽车第二款站稳高端市场的主力车型，称细分赛道神车名副其实；但放在整个国内乘用车市场，距离全民公认的年度标杆车型仍有一段差距，…

06-29

高校禁入小米汽车引争议：规则透明性合理性受拷问，管理能否多点章法？

广州华立学院校门限制小米汽车入校，引发争议，质疑规则公平性与合理性。

06-29

AI赋能家庭新生态：不同集团携手曹操出行，解锁儿童出行安全与智能出行新未来

此次与曹操出行的渠道互通，本质上是将公司的高净值家庭用户池与曹操出行的海量出行用户池进行交叉渗透：一方面，不同集团的350万私域会员将成为曹操出行“亲子出行”服务的精准种子用户，助力其差异化服务推广；另一方…

06-29

小米首款NAS“Xiaomi智能存储”将众筹，工程机配置曝光引CPU争议

06-29

戴尔P2426 24.1英寸商务显示器上架京东：1200P 100Hz 配置，售价1339元

06-29

VR跑步机Omni One与Meta Quest头显携手，开启VR游戏全身运动新体验

06-29

新疆牧民痛心发声：游客无人机惊扰致小马驹“炸肺”身亡，文明放飞引关注

06-29

宁德时代携手宝马、谷歌等巨头，共启全球能源循环经济联盟新篇章

06-29

点击查看更多 +

全站最新

启境GX7智能五座SUV官图亮相，携手华为设计，首发三折叠纯平大床引关注

MWC上海2026：运营商转型Token经营，6G产业化之路挑战与机遇并存

B站17周年陈睿谈优质内容：用户力挺，UP主充电收入劲增71.1%

极巡科技：以“汽车级”智能技术，引领三轮车行业迈入新纪元

夏日加油必知：加满隐患、油品保质期及劣质油辨别与维权指南

7月1日新规落地！电动汽车安全与电池标准双升级，保障出行更安心

热门内容

本栏最新

MWC上海2026：运营商转型Token经营，6G产业化之路挑战与机遇并存

B站17周年陈睿谈优质内容：用户力挺，UP主充电收入劲增71.1%

大杨哥“月饼风波”后现身卖课，3天收费1980元，大小杨哥复出带货时间成谜

小米Buds 5：轻量化设计搭配出色降噪，舒适与音质兼备的蓝牙耳机新宠

小米智能音箱：开启便捷生活，语音交互与优质音质共筑智能新体验

广州某高校“拒小米汽车于门外”：可预约进校成摆设，禁令背后原因成谜

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.