滚动资讯

当前位置：首页 > 资讯 > 数码极客 > 正文内容

AI“剪辑师”大挑战：专业视频后期制作，最强模型成功率仅三成多？

时间：2026-05-29 01:51:51 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

用AI生成视频素材已非难事，但要让AI独立完成从剪辑到成片的完整流程，目前仍面临巨大挑战。中国传媒大学联合新加坡国立大学和USEIT AI团队构建的CutVerse测试平台，首次对AI智能体在专业视频编辑软件中的表现进行了系统性评估。结果显示，即便最先进的AI模型，在复杂后期任务中的成功率也仅约36%，这一数据暴露出AI在专业创作领域的显著短板。

研究团队将AI视频创作分为两个阶段：前段通过Keling、即梦等工具生成素材，后段则依赖AI智能体在Premiere Pro等专业软件中完成剪辑、调色、特效叠加等操作。CutVerse平台专门设计用于测试后段能力，其核心在于模拟真实创作环境——AI需像人类一样通过屏幕视觉反馈操作鼠标键盘，而非调用后台接口。这种设定确保了测试结果能真实反映AI在专业场景中的实用性。

为构建测试体系，研究团队邀请10位资深视频创作者设计了186个任务，覆盖7款专业软件的操作流程。这些任务被细分为九大类别，从基础软件启动到高级遮罩追踪，操作复杂度呈阶梯式分布。例如，简单任务仅需打开软件或导出文件，而极限难度任务则要求AI在时间轴上精确到像素级操作，或同时协调多个软件的数据交互。每个任务被拆解为多个里程碑，AI需逐一通过视觉验证才能进入下一阶段。

测试环境采用标准化Windows虚拟机，确保每次评估的初始条件完全一致。AI的操作记录通过屏幕截图和操作日志双重验证，评估系统结合GPT-5.4和Claude-4.6-Opus两大语言模型，对每个里程碑进行交叉判断。人工对照实验显示，该自动评判系统与专业人员判断的吻合率高达98.3%，为数据可靠性提供了有力支撑。

参与测试的五款AI模型涵盖商业闭源和开源领域，包括Claude-Opus-4.6、Gemini-3-flash等顶尖选手。在程序性操作（如软件启动、素材导入）中，所有模型均表现出色，成功率普遍超过90%。但当涉及核心编辑任务时，性能出现断崖式下跌：遮罩追踪任务中，表现最佳的Gemini成功率仅38.1%，而开源模型UI-TARS-1.5-7B的准确率不足10%。这种反差凸显出AI在复杂操作序列中的脆弱性——即使单个步骤正确，多步串联时仍可能因误差累积导致全盘失败。

失败案例分析揭示了四大技术瓶颈：其一，专业图标识别困难，AI常混淆形状相似的工具按钮；其二，空间定位精度不足，时间轴操作偏差可达半秒以上；其三，缺乏全局工作区感知，易因视野局限导致重复操作；其四，对延迟视觉反馈的处理能力薄弱，容易陷入无效重复循环。这些问题在After Effects等复杂软件中尤为突出，其平均任务步数虽仅14.81步，但每步操作需协调多个快捷键和鼠标动作，对AI的协调性要求极高。

不同软件的表现差异进一步印证了操作复杂度的影响。可灵等AI生成工具因界面规整、操作直接，任务成功率普遍超过80%；而Premiere Pro、After Effects等专业软件的成功率则徘徊在40%-60%之间。After Effects成为AI的"终极考场"，其任务涉及多层级结构操作和精确像素定位，即便是顶级模型Claude，在该类任务中的成功率也仅57.7%。

研究团队提出的"氛围剪辑"概念描绘了AI视频创作的理想图景：用户只需提出创意需求，AI即可自动完成素材生成与后期制作，最终交付可直接发布的成品。然而CutVerse的测试数据表明，这一愿景的实现仍需突破多重技术障碍。当前AI在长序列操作中的可靠性、复杂界面的识别精度，以及跨模态协调能等方面，均与专业要求存在显著差距。

该研究的完整数据集和测试代码已在GitHub开源，预印本论文可通过arXiv:2605.19484获取。这项工作不仅为AI智能体研究提供了标准化评估框架，更通过精细化失败分析，为后续技术优化指明了具体方向。对于视频创作者而言，短期内AI尚无法替代人类在精细操作和专业判断中的核心作用；但对于技术研发者，CutVerse平台已成为检验AI专业领域适应能力的重要基准。

更多>同类资讯

电瓶车换石墨烯电池别跟风！适配条件、真实优缺点大揭秘，选对才划算

07-03

VAIO再携手迪士尼，借《玩具总动员》热潮推出主题联名笔记本电脑

07-03

山灵Q2音乐播放器新品预热：极简交互+双接口设计，预计本月底上市

07-03

英特尔锐炫Pro显卡2026Q2驱动更新，SPECviewperf 15测试表现显著提升

07-03

哈苏与Capture One携手合作，Capture One新版本原生支持哈苏中画幅相机RAW格式编辑

07-03

哈苏与Capture One强强联手，摄影师可享原生工作流及专属影像优化体验

07-03

“雪龙”兄弟大连港开放展示邀公众探秘共鉴中国极地考察硬核实力

07-03

雅马哈“串并联混合动力系统”专利曝光：双电机搭配单缸引擎，未来能否量产引期待

07-03

蓝色起源新方案出炉：新格伦火箭采用混合CONOPS，年底前有望复飞

图源：蓝色起源新方案取消完整火箭水平转运至发射台后起竖的流程。随后，吊车把火箭吊至垂直状态，并安装到发射台上，有效载荷将在火箭立于发射台后运至现场，再由同一台吊车安装到火箭顶部。IT之家附上相关视频如…

07-03

蓝色起源新方案出炉：新格伦火箭调整发射流程目标年底前复飞

07-03

伦敦自动驾驶新星Wayve：以端到端技术，解锁全球全品牌自动驾驶新未来

07-03

苏州永阳网络科技：以定制化小程序助力高端制造企业破解售后管理难题

苏州永阳网络科技有限公司（永阳科技）通过与多家行业龙头企业的合作案例证明，小程序完全可以成为设备全生命周期管理和售后服务增值的核心工具。在对接准备中，了解到该企业产品结构复杂，永阳科技推荐了3D零件拆解预览方…

07-02

万元级线材怎么选？Brise Audio ULTIMATE系列四款耳塞升级线深度横评

不同于夜刀神的涂抹感，錦的声音是有着非常清晰的骨架和凝练的线条的，具备了4条线材中最华丽的高频表现，分离度也相当不错。作为自家铜线扛把子的八岐大蛇，在耳机升级线领域也担得起“铜线王者”这个称号了，不管是作为…

07-02

红魔游戏平板5 PRO深度评测：RGB水冷加持便携与性能完美融合的游戏利器

06英寸的机身尺寸拿捏得恰到好处，在随身便携性与大屏沉浸感之间达成了精妙平衡；185Hz超高刷新率搭配响应迅速的触控表现，让游戏操作体验跃升了一个层级；再加上双Type-C接口、纯平背板等细节设计，精准解决了…

07-02

从老式收音机到智能音频设备：百年迭代让聆听更自由，精神生活更丰富

回望音频科技的发展历程，从老式收音机、磁带播放器，到MP3、智能蓝牙音频设备，技术不断更新升级，让声音传播更清晰、聆听更自由，持续丰富普通人的日常闲暇与精神生活。早年音频娱乐设备十分单一，老式收音机是主流听…

07-02

点击查看更多 +

全站最新

百度基础模型换帅：97年孙天祥接棒，能否带领百度大模型破局突围？

具身智能落地：74元3小时机器人服务，烧钱赛道是泡沫还是新机遇？

远景动力46120大圆柱电池量产启航助力宝马“新世代”车型续航空间双提升

零跑B10新动作来袭！官宣新车色，配置亮点与价格信息一览

大众拟引入中国车型至欧洲：方案评估中，首席财务官存疑虑引关注

富维车轮分公司携手龙头，新型钢车轮助力智能网联汽车新赛道

热门内容

本栏最新

电瓶车换石墨烯电池别跟风！适配条件、真实优缺点大揭秘，选对才划算

哈苏与Capture One强强联手，摄影师可享原生工作流及专属影像优化体验

雅马哈“串并联混合动力系统”专利曝光：双电机搭配单缸引擎，未来能否量产引期待

红旗全新一代天工08预售开启：超国标电池加持，多项升级价格更香！

14.38万起！零跑全新C11满配登场，科技豪华与驾控实力全面进阶

两年里程未破万？低里程车保养抓住这三项，省钱又护车！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.