ITBear旗下自媒体矩阵:

视频生成赛道激战正酣!Runway Gen-4.5登顶,可灵O1强势入局

   时间:2025-12-03 03:54:08 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

海外AI视频生成领域近日迎来新一轮技术竞赛高潮。当地时间12月1日,初创企业Runway推出第四代半视频生成模型Gen-4.5,在权威基准测试Artificial Analysis中以1247分超越谷歌Veo3登顶榜首。仅隔一小时,中国团队可灵AI便在海外社交平台宣布上线全新多模态视频模型O1,两大新品同日亮相引发行业高度关注。

根据最新榜单数据,谷歌Veo3以1226分位列第二,快手可灵2.5以1225分紧随其后,OpenAI的Sora2 pro与MiniMax海螺02分别排名第七、第八。值得注意的是,Gen-4.5在正式发布前曾以"Whisper Thunder"代号参与测试,通过匿名评审机制提前锁定最佳文生视频模型称号。

Runway团队透露,新模型在预训练数据利用率和后训练优化技术上取得重大突破。用户可通过单条指令实现复杂镜头调度、场景构图设计、事件时间编排及氛围精准控制。测试显示,模型在提示词响应精度、物理运动模拟、风格统一性等维度均有显著提升,尤其在液体动力学、材质渲染等细节处理上达到新高度。

官方演示案例中,由西瓜、仙人掌等物品搭建的支撑结构上,鹦鹉振翅时西瓜呈现真实晃动效果,羽毛动态与光影变化均符合物理规律。但技术人员坦言,当前模型仍存在因果逻辑缺陷,偶发物体突然消失或时间顺序错乱等问题。Runway首席执行官Cristóbal Valenzuela表示,解决对象恒存性等基础问题将是下一代模型研发重点。

这家成立于2018年的初创公司凭借百人团队实现技术突围,目前估值已达35.5亿美元。自2023年2月发布首代模型Gen-1以来,其技术迭代速度持续领先行业。面对谷歌Veo系列带来的竞争压力,此次产品升级被视为巩固市场地位的关键举措,公司同步推进的新一轮融资计划引发资本界关注。

国内方面,可灵O1虽暂未进入Artificial Analysis榜单,但其"统一多模态"的技术定位引发期待。该模型宣称突破传统视频生成框架,实现文本、图像、视频等多类型输入的协同处理。行业观察人士指出,随着头部企业技术差距缩小,2025年视频生成领域将进入多维竞争阶段,谷歌Veo4等潜在新品可能随时改写现有格局。

技术突破背后,物理引擎精度与创作自由度的平衡仍是核心挑战。Runway研发团队承认,当前模型在模拟复杂力学系统时仍需人工干预,例如多物体交互场景中的受力计算尚未完全自动化。这种技术局限性在创意产业应用中尤为明显,某动画工作室测试反馈显示,生成30秒专业级视频仍需20%的手动修正工作。

市场研究机构预测,随着Gen-4.5等新品开放商用,AI视频生成成本有望在2026年前下降60%。Runway宣布将维持现有订阅价格体系,通过技术优化实现"加量不加价"。这种定价策略可能引发行业连锁反应,国内厂商是否跟进调整商业模式成为新的观察焦点。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version