谷歌近日宣布,旗下AI视频生成模型Veo 3正式接入Google Photos应用,美国用户可通过“创建”选项卡中的“细微动作”或“手气不错”功能,将静态照片转化为四秒动态视频。这一升级取代了7月上线的Veo 2模型,谷歌发言人Marconi表示,新版本在视频清晰度与真实感方面实现显著提升。
回顾技术演进,谷歌在今年5月的I/O开发者大会上首次发布Veo 3模型,同步推出文本转视频工具Flow。8月,AI视频编辑器Vids的早期版本上线,其核心功能包括通过AI虚拟形象代用户传达信息。当时,Gemini副总裁Josh Woodward强调,Veo 3的突破性在于“极其逼真”的声音生成能力,但该功能初期仅向每月订阅费250美元的“AI Ultra”用户开放。
当前版本中,免费用户每日可生成“有限数量”的无声视频,而Ultra与Pro订阅用户则享有更高配额。功能整合方面,除基础动态转换外,用户还能将照片重塑为3D动画并导出视频。新增的“精彩时刻”功能可基于用户输入的关键词,自动从图库中筛选照片并生成集锦视频。
从技术路径看,谷歌正通过分层策略推动AI工具普及:基础功能面向大众用户,高级特性则作为付费服务。此次更新不仅强化了Google Photos的多媒体处理能力,也标志着AI生成内容从专业场景向日常应用进一步渗透。