在2026谷歌I/O开发者大会上,谷歌宣布了一项引人注目的技术突破:将Project Genie的世界生成能力深度整合至谷歌街景服务中,为通用世界模型的应用开辟了新维度。这一创新旨在通过融合真实地理数据与虚拟环境构建技术,打造兼具现实基础与想象空间的交互式数字世界。
作为谷歌研发的通用世界模型,Genie的核心优势在于其动态环境生成能力。与传统图像生成工具不同,该系统不仅能输出静态画面,更能构建包含物理规则、可交互元素的3D场景。这种特性使其成为AI智能体训练的理想平台——通过模拟真实世界的复杂环境,帮助机器人学习导航、物体操作等关键技能,同时为虚拟体验和互动内容创作提供技术支撑。
此次技术整合实现了三大突破:首先,系统突破了纯虚拟场景的限制,能够以真实街景图像为基底,生成可探索的3D数字孪生世界;其次,用户可通过交互界面自定义场景风格,输入"未来都市"或"史前丛林"等关键词,系统将自动调整环境元素;最后,新增的角色描述功能允许用户指定虚拟化身,系统会围绕该角色设计符合其行为逻辑的互动场景。例如,用户选择纽约中央公园后,可设定化身角色为"科幻小说中的机械师",系统将生成包含未来科技装置的公园场景。
在操作流程上,用户只需在Google Maps中选定美国境内任意地点,通过地图图钉功能进入创作界面。系统提供风格化选项与角色描述输入框,用户完成设置后,Genie将启动实时渲染引擎,在数秒内生成包含完整物理交互的虚拟世界。目前支持的环境风格库包含20余种预设主题,角色描述则支持自然语言输入,系统通过语义分析自动匹配场景元素。
该技术当前仍处于实验阶段,存在两方面限制:地理范围仅覆盖美国境内街景数据,且部分复杂场景的物理模拟精度有待提升。谷歌产品团队透露,后续迭代将重点优化三方面:扩大地理数据覆盖范围、增强多角色协同交互能力、开发创作者工具包以支持专业内容生产。不过具体的时间规划尚未公布,技术团队表示需要根据首阶段用户反馈确定开发优先级。






