谷歌近日对其人工智能助手Gemini Live进行了全面升级,旨在为用户提供更加流畅和直观的实时对话体验。据悉,从即将到来的一周起,Gemini Live将新增一项引人注目的功能:它能够在用户屏幕上直接高亮显示内容,特别是在用户分享摄像头画面时,这一功能将让用户能够迅速定位到AI助手所指的特定物品。
想象一下,当你面对一堆工具,急需找到适合完成某个项目的那一把时,只需简单地将智能手机摄像头对准这些工具,Gemini Live便能迅速在屏幕上标记出正确的选择。这一创新功能将率先在8月28日发布的全新Pixel 10系列手机上亮相,随后,谷歌计划将其推广到更多安卓设备,并在未来几周内实现对iOS系统的支持。
谷歌还宣布了Gemini Live与一系列应用程序的深度整合,使其能够与消息、电话和时钟等核心应用无缝协作。举例来说,在与Gemini讨论前往某地的路线时,若你突然意识到可能会迟到,只需简单中断对话,告诉它:“这条路线不错,帮我给亚历克斯发个消息,说我大概会晚到10分钟。”随后,Gemini将自动为你起草并发送一条短信给你的朋友。
不仅如此,谷歌还为Gemini Live引入了一款全新的音频模型,据称,该模型将显著提升聊天机器人对人类语音特征的理解和运用,包括语调、节奏和音高等关键要素。这意味着,在不久的将来,Gemini将能够根据你讨论的话题灵活调整其语调,例如,在谈及压力较大的话题时,它会采用更加平和的声音来回应你。
更令人兴奋的是,你还可以根据个人喜好调整Gemini的说话速度,无论是希望它说得更快一些还是更慢一些,都能轻松实现。更有趣的是,如果你请求Gemini从某个特定角色或历史人物的视角来讲述一个故事,它可能会尝试模仿相应的口音,为你带来一场“生动、引人入胜”的叙事体验。