谷歌近日为其人工智能助手Gemini推出了一项名为“个人智能”的新功能,引发科技界广泛关注。这项功能允许Gemini接入用户的Gmail邮箱、Google Photos相册、YouTube观看历史以及搜索记录,通过分析这些数据提供更具针对性的回答和建议。
谷歌应用副总裁在社交媒体上展示了更多应用场景:当用户询问车牌号码时,Gemini可以从照片中提取数字,并通过搜索Gmail确认车辆配置;当用户需要理发预约时,Gemini能根据邮件记录记住上次理发时间,并主动询问是否需要预约。这些功能展示了AI从简单问答向主动服务转型的趋势。
技术架构方面,该系统分为三个层级:产品接入层以Gemini应用为主,未来将扩展至搜索AI模式;模型使能层以Gemini 3系列为核心,提供语义理解、逻辑推理和多模态处理能力;最底层是新建的“个人智能引擎”,作为连接模型与私有数据源的中间件,负责精准调度用户数据。
实现这些功能依赖三大技术支柱:首先是Gemini 3增强的推理能力,能理解复杂个人语境如家族关系或审美偏好;其次是强化后的工具调用能力,模型可主动生成检索指令获取相关信息;最关键的是超长上下文处理与“上下文打包”技术,通过动态识别关键信息片段,突破百万token的上下文窗口限制。
系统采用进化版RAG技术,对用户邮件、照片和搜索历史进行实时向量化处理,形成“私有知识库”。当用户提问时,模型生成检索指令从知识库提取相关数据片段,而非直接存储原始数据。这种设计既保证了个性化服务,又避免了隐私数据在模型中的长期留存。
在隐私保护方面,谷歌强调该功能默认关闭,需用户主动授权并选择连接的应用。数据传输和存储过程采用加密技术,且明确表示不会直接使用用户邮件或照片训练模型。不过公司承认会使用“特定提示词和模型响应”以及“摘要、摘录和推断”来改进功能,这种表述引发了对数据使用边界的讨论。
当前功能仍存在局限性。谷歌实验室负责人提醒,尽管经过广泛测试,用户仍可能遇到不准确响应或过度个性化问题,特别是在处理关系变化或多元兴趣场景时。例如,当用户与伴侣分手后,系统可能仍会基于过往数据提供不恰当建议。
这项功能的推出恰逢谷歌计划在AI购物工具中引入个性化广告之际。未来广告主可通过Gemini驱动的搜索AI模式,向潜在购买者提供独家优惠。这引发了关于AI助手定位的讨论:它究竟是纯粹的生产力工具,还是隐藏的营销渠道?
谷歌在技术白皮书中将“个人智能”描述为“迈向真正个性化AI的一步”,承认这仍是早期阶段。随着功能逐步扩展至免费用户、与搜索深度整合,甚至可能接入第三方服务,如何平衡技术创新与隐私保护、确保用户知情权,将成为持续面临的挑战。











