近日,谷歌DeepMind团队震撼发布其最新研发成果——Genie 3,这是一款被寄予厚望的通用型世界模型。据PANews报道,Genie 3能依据文本提示,即时构建出多元化的交互式虚拟环境,其生成速度可达24帧/秒,分辨率更是高达720p,为用户带来了前所未有的沉浸式体验。
尤为引人注目的是,Genie 3创新性地引入了“可提示世界事件”功能,用户仅凭简单的文字指令,便能随心所欲地调整虚拟世界,无论是增添一群悠然自得的鹿群,还是变换天气状况,皆能轻松实现。这一特性极大地提升了用户的参与度和创造力。
外媒高度评价了Genie 3的发布,认为这标志着DeepMind在迈向通用人工智能(AGI)的征途上迈出了坚实的一步。Genie 3不仅为AI智能体的训练开辟了一个更为广阔的模拟天地,更为游戏开发、教育领域以及创意设计等多个行业带来了革命性的变革。例如,在模拟仓库环境中,机器人无需承担真实世界的试错成本,便能学习应对各种不可预知的复杂场景。
然而,尽管Genie 3在技术上取得了令人瞩目的突破,但其仍存在一些亟待解决的问题。目前,该模型仅支持数分钟的连续交互,远未达到理想的数小时交互时长。AI智能体在模拟环境中的交互能力尚显不足,特别是在复杂多智能体交互方面,仍有待进一步深入研究和探索。为了进一步优化模型并评估潜在风险,DeepMind目前正以研究预览的形式,向部分学者和创作者开放Genie 3。