微软在7月29日为其Edge浏览器推出了全新的Copilot模式,这一举措标志着这家科技巨头正式进军AI浏览器市场。在过去两年里,微软对Edge浏览器的AI功能进行了数次小幅更新,但此次推出的Copilot模式则是一次更为显著的变革。
与传统的AI功能不同,Copilot模式不仅仅是作为一个聊天侧边栏存在。它能够让AI阅读并理解网页内容,例如帮助用户解读技术文档或生成Youtube视频的观看大纲。Copilot还能同时浏览用户已打开的所有网页,并在用户对比多个商品或酒店页面时,提供一个对比表格来辅助决策。
为了增强用户体验,微软还增加了语音功能,用户可以通过语音与AI实时对话,从而更便捷地理解网页内容。微软CEO萨提亚·纳德拉对这一新功能赞不绝口,他表示,Copilot模式是微软为AI时代重新定义浏览器的第一步,并特别提到了他喜欢的multi-tab RAG功能,该功能能帮助他更快地分析微软在Nature上发表的论文。
目前,Copilot模式仍处于实验阶段,微软计划逐步为其增加新功能。值得注意的是,在实验期间,Copilot模式是限时免费的。由于Copilot的基础模型支持来自OpenAI,这意味着用户能够免费使用部分ChatGPT的付费功能,例如DeepResearch功能。纳德拉还透露,微软将推出任务代理功能,使用户能够在浏览网页的同时委托Copilot处理任务。
这一举措使得Edge浏览器在AI浏览器市场中具备了一定的竞争力。在OpenAI正式推出自家浏览器之前,用户可以在Edge中体验到类似ChatGPT的功能,这无疑为那些寻求ChatGPT平替版的用户提供了一个新的选择。然而,尽管Copilot模式带来了诸多创新,但其功能仍局限于现有AI浏览器的基础能力范畴。
微软在官方发布的产品更新中,对Copilot模式使用了诸如“网络互动方式的转折点”和“探索更强大网页浏览方式”等宏大词汇。然而,当用户实际打开Copilot模式时,最直观的感受可能是主页界面变成了一个Copilot对话框。用户可以在其中输入关键词进行Bing搜索,或直接与Copilot对话。Copilot能够理解用户意图,帮助用户更高效地理清信息,减少被繁杂标签页困扰的情况。
以Manus在官网发布的AI Agent上下文工程的技术文档为例,Copilot能够理解网页内容,为用户提供文档解读或大纲。它似乎还能理解视频内容,例如对Youtube视频进行要点整理,生成视频摘要。对于电商网站,Copilot能够根据商品详情页进行AI总结,提供历史价格走势图和其他网站的比价信息,不过这一功能目前仅适用于亚马逊、Shein等海外购物网站,国内电商网站尚不支持。
尽管如此,Copilot模式还是具备一些显著区别。例如,其AI tab grouping功能可以自动按主题将标签页归组,multi-tab RAG功能则可以让AI浏览用户已打开的所有标签页内容,无论是阅读论文、比较酒店还是浏览新闻,都能快速启用该功能,帮助用户轻松比较、决策和完成任务。然而,和市面上其他号称具备Agent能力的产品一样,Copilot并未打通支付环节,无论是预定酒店、购买商品还是规划行程,都无法实现无缝体验。
在语音功能的加持下,Copilot模式增加了一个颇具科幻感的Vision功能。用户可以用语音与Copilot实时对话,无论正在浏览什么网页,都可以直接语音提问。这一功能提高了用户的交互体验,使其更加接近即时沟通。然而,尽管Copilot模式带来了诸多创新,但当下的AI浏览器市场仍处于混战阶段,远未达到终极形态。
随着大模型的诞生,人们获取信息的方式发生了深刻变化,浏览器作为桌面端触达互联网的第一窗口,也面临着变革。科技公司们纷纷试图抢占这一市场,推出具备AI能力的浏览器。然而,尽管AI浏览器市场潜力巨大,但当下的产品形态仍局限于对传统浏览器体验的增强,而非彻底颠覆。微软早在2023年就开始为Edge浏览器加入AI功能,但并未对Chrome造成太大威胁。AI浏览器的隐私安全问题也引发了用户担忧。