ITBear旗下自媒体矩阵:

谷歌I/O大会亮点:AI搜索新体验,AR眼镜重生,大模型全面升级

   时间:2025-05-21 11:04:31 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在谷歌I/O开发者大会的凌晨时段,一场关于人工智能(AI)的盛宴拉开了帷幕。谷歌CEO桑达尔·皮查伊携公司高管们,在不到两小时的演讲中,频繁提及“Gemini”和“AI”,分别高达95次和92次,彰显了谷歌在AI领域的雄心壮志。

在模型升级方面,谷歌推出了Gemini 2.5 Pro,新增原生音频输出、深度思考模式和高安全防护等功能。同时,视频模型Veo 2也加入了原生音频生成能力,而Gemini 2.5 Flash则在推理、编程和长上下文处理上实现了显著提升。谷歌还发布了Gemini Diffusion扩散语言模型、Veo 3视频生成模型和Imagen 4图像生成模型,进一步丰富了其AI产品线。

为了满足不同用户的需求,谷歌推出了全新的Gemini订阅计划。AI Pro用户每月支付19.99美元,即可使用Veo 2和Gemini 2.5 Pro等入门级产品;而AI Ultra用户则需支付249.99美元,以获得Veo 3的无限访问权限和Gemini 2.5 Pro的深度思考模式等高级功能。

谷歌DeepMind的创始人戴密斯·哈萨比斯表示,Gemini的目标是成为一个世界模型,这是开发新型、更通用、更有用的AI助手的关键一步。在展示的一个自行车维修场景中,Gemini不仅能够查询维修手册、搜索视频教程,还能拨打电话、查询零件库存并帮助用户下单,展现了其强大的多功能性。

谷歌还推出了AI Mode,旨在颠覆传统的搜索体验。根据用户的需求,AI Mode可以动态调整答案生成界面,包括图表、店铺列表等。在购物场景中,AI Mode能定制购物界面,提供虚拟试穿、追踪预期价位和代理结账等功能,同时集成了视觉搜索,用户可通过手机摄像头实时拍照搜索。

谷歌的三大研究项目也取得了显著进展。Project Starline引入了全新的3D视频通讯体验,Project Astra利用Gemini和摄像头解决问题,而Project Marina则支持多任务处理,使Agent能够同时监管多项任务。

大会尾声,谷歌现场演示了安卓XR智能眼镜,并宣布与XREAL合作打造第二款安卓XR设备Project Aura。这款眼镜具备翻译能力,尽管在测试时出现了识别问题,但谷歌表示将继续优化。

皮查伊透露,Gemini应用目前拥有超过4亿月活用户,超过700万名开发者通过Gemini API进行开发。这些数据表明,谷歌在AI领域的努力正逐步获得市场的认可。

在Gemini时代,谷歌的模型和产品发布速度明显加快。自第一代Gemini模型发布以来,其Elo分数已提升300多分,并在多个领域取得了显著成果。例如,在编程方面,Gemini 2.5 Pro成为Cursor平台上年度增长最快的模型,每分钟产出数十万行被采纳的代码。

谷歌还展示了其全栈基础设施的进步,第七代TPU Ironwood专为大规模AI思考和推理工作负载设计,性能是上一代的10倍。同时,谷歌每月通过产品和API处理的token数量在一年内增长了约50倍,显示出其AI处理能力的巨大提升。

在模型架构创新方面,谷歌将扩散模型技术应用于文本生成,推出了Gemini Diffusion实验模型。该模型不仅生成速度快,还能在生成过程中快速迭代解决方案并进行错误纠正。

谷歌还致力于将Gemini模型扩展为一个“世界模型”,以提升其对物理世界的理解能力。为此,谷歌微调了Gemini Robotics模型,使机器人能够学习抓取物体、遵循指令等任务,并即时适应新任务。

谷歌的最终愿景是将Gemini打造成真正的通用AI助手,具备个性化、主动性和强大能力。这一目标的实现将为用户带来更加便捷和智能的体验。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version