OpenAI正式发布Sora应用,其核心引擎升级为Sora 2模型,标志着视频生成技术进入全新阶段。这款被研发团队称为"最强大影像引擎"的系统,在物理交互、多模态生成和个性化创作方面实现突破性进展,同时推出Cameo功能让用户深度参与内容创作。
Sora 2的技术突破集中体现在三大领域。首先是物理引擎的质的飞跃,系统能精准模拟体操运动员的空中翻转、滑板运动的复杂碰撞等动态场景,物体运动轨迹和力学表现达到前所未有的真实度。其次是多镜头叙事能力,用户可一次性生成包含多个场景切换的长视频,突破传统模型逐镜头制作的局限。第三是音视频同步生成技术,支持多语言对话、多角色配音及环境音效的自动匹配。
Cameo功能成为本次更新的核心亮点。通过分析用户提供的30秒视频素材,系统能建立三维数字分身,并将其无缝嵌入任意虚拟场景。这项基于世界模拟模型的技术,不仅适用于人物形象,还能识别宠物、物体等非人类主体。用户可自主设置形象使用权限,防止未经授权的二次创作,同时通过偏好设置调整生成效果,避免出现不符合预期的细节。
产品界面设计融合社交媒体特性,用户拥有个性化主页并可建立关注关系,但所有内容均由AI生成。简易编辑器支持文字描述转视频功能,用户输入场景设定、风格要求等文本指令即可获得成品。混音功能允许用户参与热门创作趋势,对现有内容进行二次改编。为保障创作安全,系统设置多重验证机制,包括动态音频检测和头部动作识别。
在内容治理方面,平台建立分级防护体系。未成年用户默认开启防沉迷模式,设置使用时长限制和强制休息间隔。所有输出内容均添加隐形数字水印,可追溯生成源头。内部推理模型实时监测违规内容,尤其在Cameo功能中严格禁止色情、暴力等不当创作。针对用户创作权,平台明确生成内容的所有权归属,创作者可随时删除授权内容。
商业应用层面,现有Web端将新增故事板功能,支持逐镜头精细化编辑。开发者API接口计划在未来数周内开放。移动端应用率先登陆北美市场,采用邀请制逐步扩大用户规模,每位初始用户可获得4个邀请名额。系统内置的创意模板库已涌现大量用户生成内容,涵盖虚拟广告、奇幻短片等多元形式。
该研究项目始于2023年初,核心目标是通过构建物理世界模拟系统,推动通用人工智能发展。研发团队认为,精确理解物理规律是实现真正AGI的关键前提。此次升级的Sora 2不仅提升技术指标,更通过Cameo等创新功能,重新定义了人机协作的内容生产方式。