近日,科技巨头谷歌旗下的DeepMind团队宣布了其在人工智能领域的又一重大突破——Genie 3世界模型的诞生。这一创新成果被视为向通用人工智能(AGI)迈出的关键步伐,其能力之强大,足以让人叹为观止。
Genie 3以其前所未有的实时互动性和高度一致性,为用户打开了一个全新的虚拟世界大门。在这个由文本即时生成的世界中,用户可以以每秒24帧的流畅度和720p的高清分辨率,自由探索每一个角落。这一模型的成功构建,得益于DeepMind团队在Veo 2和Genie 2项目上的深厚积累与紧密合作。
令人惊叹的是,Genie 3不仅具备强大的生成能力,还能保留长达一分钟的空间记忆。这意味着,在这个虚拟世界中发生的任何变化,都将被模型准确记录并持续影响后续场景。例如,当角色在墙上刷漆后移动至别处,再次返回时,墙上的漆迹依然清晰可见。随着训练数据的不断增加和深化,模型中的物理规律表现愈发真实,无论是水的流动还是光照的变化,都栩栩如生,仿佛置身于现实世界之中。
更令人称奇的是,Genie 3在模拟现实世界方面的能力实现了质的飞跃。其生成的视频内容几乎达到了以假乱真的地步,让人难以分辨虚实。通过大规模数据的训练,模型涌现出了一系列符合人类直觉的行为。当角色靠近门时,它会自然地推测并尝试打开门;下水时,则会游泳或溅起水花。这些行为并非人为设计,而是模型自主学习的结果,展现了其惊人的智能和适应性。