微软近期在Edge浏览器中引入了备受瞩目的Copilot模式,此举标志着这家科技巨头正式进军AI浏览器市场。经过两年的小范围尝试与优化,Edge的AI功能如今已焕然一新,不再局限于简单的聊天侧边栏。
Copilot模式的推出,使得Edge浏览器能够阅读并理解网页内容,为用户提供诸如技术文档解读、视频观看大纲等实用功能。对于经常在多个商品或酒店页面间犹豫不决的用户,Copilot还能生成对比表格,辅助做出决策。微软还增加了语音功能,用户可以通过语音指令与AI实时互动,获取网页信息。
尽管这些功能在市面上已有类似产品,但微软CEO萨提亚·纳德拉对Copilot模式赞不绝口,认为它是微软为AI时代重新定义浏览器的第一步。纳德拉特别提到了multi-tab RAG功能,该功能能让他更高效地分析微软在Nature上发表的论文,言语间透露出对新功能的自豪。
目前,Copilot模式仍处于实验阶段,微软计划逐步加入更多新功能。值得注意的是,在实验期间,Copilot模式是限时免费的。由于Copilot由OpenAI提供基础模型支持,用户实际上可以免费体验一些ChatGPT的付费功能,如DeepResearch等。
纳德拉还透露,微软将推出任务代理功能,允许用户在浏览网页的同时委托Copilot处理任务。这一消息让不少AI创业者看到了ChatGPT Agent的免费替代版,毕竟ChatGPT Agent目前仅向Plus及以上用户开放,最低月付费为20美元。
然而,尽管Copilot模式带来了诸多创新,但用户体验上并未带来颠覆性的改变。打开Copilot模式后,用户会看到一个整合了对话、搜索和网页导航的对话框。用户可以通过关键词启用Bing搜索或直接与Copilot对话。Copilot能够理解用户意图,帮助用户高效地理清信息,减少标签页面的困扰。
以AI Agent上下文工程的技术文档为例,Copilot能够理解网页内容,为用户提供文档解读或大纲。同时,它也能理解视频内容,如整理Youtube视频的要点,生成摘要。在电商网站上,Copilot还能根据商品详情页进行AI总结,提供历史价格走势图、比价等功能,但目前这些功能主要适用于海外购物网站,国内电商网站尚不支持。
与市面上的AI浏览器相比,Copilot模式的显著区别在于其主动性。例如,AI tab grouping功能可以自动按主题将标签页归组,multi-tab RAG功能则能让AI浏览用户已打开的所有标签页内容,无论用户是在阅读论文、比较酒店还是浏览新闻,都能快速启用该功能,帮助用户比较、决策和完成任务。
尽管如此,Copilot模式并未实现支付环节的打通。无论是预定酒店、购买商品还是规划行程,用户仍需要手动操作,无法享受宣传片中的无缝体验。虽然Copilot能够阅读PDF文档,并接入OpenAI的文生图能力,但在实际应用中仍存在不少错误,如图表数据不完整等。
在语音功能的加持下,Copilot模式增加了一个颇具科幻感的Vision功能。用户可以通过语音与Copilot实时对话,无论正在浏览什么网页,都可以直接语音提问。然而,这一功能也并非新鲜事物,其他AI浏览器如Comet等同样支持语音实时交互。
就当下体验而言,Copilot模式的许多功能与现有AI浏览器并无太大差异。微软强调Copilot仍处于实验阶段,并将继续增加新功能,用户可自行选择开启或关闭。在AI浏览器市场混战之际,或许还未到终极形态的出现。