OpenAI近日在官网宣布,正式推出一款名为“Sora”的独立社交应用,用户可通过该平台创作并分享由人工智能生成的视频内容。这款应用目前仅在苹果iOS系统上线,凭借其创新的视频生成技术和社交互动功能,迅速引发科技圈与媒体行业的广泛关注。
据App Store的描述,Sora是一款基于OpenAI最新技术的创意应用,能够将文字提示和图像转化为带有声音的超现实视频。与去年12月发布的初代版本相比,新应用不仅支持用户根据文本生成短片,还允许用户浏览他人创作的视频内容,并创建高度逼真的AI虚拟形象,嵌入到自己或朋友的视频中。这一功能被OpenAI内部称为“客串”,旨在通过增强社交互动性提升用户体验。
技术层面,Sora应用由OpenAI最新研发的视频生成模型“Sora 2”驱动。官方称,该模型在物理准确性、逼真度上达到行业领先水平,尤其在一致性、可控性方面实现重大突破。值得注意的是,Sora 2首次实现了音画同步功能,能够生成包含复杂动作和场景的视频,例如花样滑冰运动员与白猫共舞、冲浪板上完成空翻、西部牛仔同时驾驭两匹马等超现实画面。
OpenAI软件工程师托马斯·迪姆森(Thomas Dimson)在简报会上透露,团队最初对AI生成视频流的实用性存在疑虑,但“客串”功能的加入让内部认为这一形式“可能对世界产生积极影响”。他指出,当前社交平台逐渐偏离了“连接朋友”的初衷,而Sora的共创理念或能重塑这一生态。Sora团队负责人比尔·皮布尔斯(Bill Peebles)更将其比作视频生成领域的“ChatGPT时刻”,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)也在社交媒体发文支持这一观点。
此次Sora以独立APP形式发布,而非通过开放API接口升级模型,引发市场热议。分析人士认为,OpenAI此举旨在利用视频领域的先发优势,快速构建行业壁垒。过去一年中,由于初代Sora迟迟未推出正式版,谷歌的Veo3、国内的海螺AI、即梦和可灵等模型迅速崛起,OpenAI的领先地位一度受到挑战。而新应用通过允许用户创建数字分身、获得朋友分身授权等功能,或能提升用户迁移成本,在竞争对手尚未建立社交关系生态前锁定用户。
OpenAI强调,Sora的定位是共创平台而非内容消费平台。为实现这一目标,自建APP成为获取一手数据的关键——哪些视频易被分享、哪些内容具有传播力,这些包含人类情感偏好和社交属性的数据,将成为未来模型迭代的宝贵资源。通过数据与用户习惯的正向循环,OpenAI有望进一步巩固技术优势。
然而,Sora功能的增强也引发了行业对安全性的担忧。影视从业者担心其冲击就业市场,公众则对网络内容真实性产生疑虑。对此,OpenAI出台多项限制措施:禁止用户生成包含公众人物的视频,需通过授权才能使用他人形象制作内容;所有生成视频均添加水印,并禁用屏幕录制功能以控制传播。尽管如此,如何平衡创新与监管仍是OpenAI面临的长期挑战。
在AI行业估值争议不断的背景下,英伟达首席执行官黄仁勋近日公开表达了对OpenAI的看好。他在播客节目中预测,OpenAI极有可能成为全球下一个价值数万亿美元的超大规模公司,其增长速度或创行业纪录。这一观点与奥尔特曼、扎克伯格对AI泡沫的警告形成鲜明对比。黄仁勋认为,怀疑论者忽视了加速计算和人工智能对经济结构的深层重塑,未来将属于掌握这些技术的企业。