谷歌近日突然宣布,其备受瞩目的通用世界模型Genie 3正式开启公测。这一消息引发全球科技圈的广泛关注,网友纷纷惊叹“仿佛进入黑客帝国”。此次公测面向美国GoogleAIUltra订阅用户开放,且限定18岁以上人群参与。
Genie 3的诞生与一场“倒逼”密切相关。就在谷歌宣布消息的前一天,蚂蚁灵波推出的世界模型LingBot-World上线即成为行业标杆,这一成果让谷歌感受到不小的压力。事实上,谷歌早在去年8月就预告了Genie 3,但此后一直未有实质性进展,直到此次被中国AI力量“刺激”后才加速推进。
Genie 3的核心能力在于其动态交互性。与传统的静态3D场景不同,它能根据用户的行动实时生成环境——用户向前走,道路便随之出现;改变行动方式,世界布局也会相应调整。这种特性使其在机器人训练、动画制作、小说创作等领域展现出巨大潜力,甚至能模拟真实地点或历史场景。
技术层面,Genie 3与谷歌Nano Banana Pro和Gemini深度集成,形成一个网页应用。用户可通过三个步骤体验其功能:首先用文字和视觉提示词设计世界和角色;接着由Nano Banana Pro生成可调整的图像预览;最后,Genie 3在用户移动时实时生成环境。用户还能在画廊中混搭现有世界或创造全新场景。
首批体验者对Genie 3的评价褒贬不一。a16z合伙人Justine Moore测试后表示,该模型在物理规则、记忆能力和控制方式上表现出色。例如,角色无法穿透实体物体或打开关闭的门,且能记住用户离开前的场景细节。然而,其记忆功能并非完美,偶尔会出现内容丢失的情况。沃顿商学院教授Ethan Mollick则展示了更复杂的实验——他创造了一个“递归世界”,其中角色头部的显示屏实时运行另一个《毁灭战士》,而该游戏中的角色头部又是一块显示屏,形成无限嵌套的视觉效果。
游戏领域是Genie 3最受瞩目的应用场景。网友GrandDiTwo用其制作了人生首个AI视频游戏,并抛出疑问:“游戏产业的末日到了吗?”尽管当前版本仍存在缺陷,但用户已能通过提示词生成《塞尔达传说》《刺客信条》等经典游戏的模拟场景。例如,有人仅用《塞尔达传说:旷野之息》的素材,便生成了包含开阔草原、层次地形和光影变化的3D世界,效果令人惊叹。
Genie 3的“重生”机制也引发讨论。当用户角色掉入深渊时,系统会直接将其传送到新地点,而非结束游戏。这种设计让体验更具连续性,但也引发关于游戏规则边界的讨论。用户还能通过自然语言修改草图,例如保留草原世界但更换探索角色,进一步拓展了创作自由度。
随着公测开启,科技界开始对比不同技术路径。除Genie 3外,李飞飞的团队也在开发3D世界模型Marble,后者能生成永久存在的明确世界,用户可随时返回且场景保持一致。两条路径各有优势:Genie 3适合短时探索,Marble则更适合长期沉浸式体验。用户可根据需求选择合适工具。
目前,Genie 3的公测仍在持续,谷歌CEO劈柴试玩后称其“感觉棒极了”。尽管该模型仍处于早期阶段,但已展现出颠覆传统创作模式的潜力。随着用户反馈的积累,其功能有望进一步完善,而关于AI生成内容与版权保护的争议,也可能随之浮出水面。










