自谷歌推出“AI概览”功能以来,公众逐渐发现,人工智能驱动的搜索结果与传统搜索引擎提供的链接列表存在显著差异。近期一项新研究通过量化分析,揭示了这种差异的具体表现:AI搜索引擎更倾向于引用访问量较低、甚至在传统搜索前100名结果中未出现的网站。
德国波鸿鲁尔大学与马克斯·普朗克软件系统研究所的研究人员在预印本论文《生成式人工智能时代的网络搜索特征分析》中,对比了谷歌传统搜索结果与其AI概览、Gemini 2.5-Flash的功能表现,同时纳入了GPT-4o的网页搜索模式及“GPT-4o搭配搜索工具”的表现。后者仅在大语言模型判断需要外部信息时调用网络搜索。
不过,这种差异并不直接等同于AI生成结果的“质量更低”。研究发现,基于GPT的搜索更倾向于引用企业官网和百科类网站,几乎不引用社交媒体内容。通过大语言模型分析工具显示,AI搜索结果涵盖的可识别“概念”数量与传统搜索前十条结果相当,说明两者在信息细节、多样性与新颖性方面水平接近。但研究人员也指出,生成式引擎会对信息进行压缩,可能省略传统搜索结果中保留的次要或模糊内容。这种情况在处理含义模糊的搜索词(如多名公众人物共用的名字)时尤为明显,此时传统搜索结果的信息覆盖更全面。
AI搜索引擎的优势在于能将预训练的“内部知识”与引用网页信息结合。例如,“GPT-4o搭配搜索工具”模式常不提供外部引用链接,而是直接基于训练数据给出答案。这种特性在处理知识类问题时表现突出。
然而,对预训练数据的依赖也使其在查询时效性强的信息时存在短板。当研究人员使用谷歌9月15日“实时热搜榜”中的关键词测试时,“GPT-4o搭配搜索工具”常返回“您能否提供更多详细信息?”的提示,而非主动搜索最新网络资讯。











