近期,欧洲正酝酿一场针对搜索引擎领域的重大变革,旨在打破对现有搜索巨头的依赖,特别是针对Google搜索质量下滑及生成式AI整合后的不尽人意表现。这一变革的核心在于构建一个公共网页索引(Open Web Index),为新型搜索引擎的开发提供坚实的基础。
据悉,该公共索引的早期试验将于下个月正式启动,由多家欧洲机构联手推进,包括大学、数据中心、科技公司以及著名的欧洲核子研究中心(CERN)。这一项目的推出,旨在减轻欧洲国家对于广告驱动型搜索引擎的过度依赖,特别是在美国科技巨头愈发将搜索服务向生成式AI与广告优化倾斜的背景下。
Open Web Index并非一个直接的搜索引擎,而是更像一座数字资源的宝库,供各类搜索引擎从中挖掘网页与文件。当前,主流搜索引擎多依赖于专有索引,小型搜索引擎则往往依附于这些大型系统。Open Web项目指出,这种高度集中的结构赋予了Google等公司过大的网络控制权。
欧洲监管机构,特别是英国与欧盟方面,长期以来一直在对抗美国科技巨头的垄断行为,特别是在搜索与人工智能等关键领域。与此同时,全球用户普遍反映搜索结果质量下滑,许多网站运营者也抱怨Google正在构建一个封闭的生态系统,限制用户流向其他平台。生成式AI工具频繁出现信息不准确的问题,进一步加剧了这种不满。
为了应对这些挑战,一个由14个成员机构组成的联盟应运而生,致力于出资并构建开放网页索引的基础设施。这一项目不仅将服务于搜索引擎的研发,还将助力中小企业构建大语言模型(LLM)或其他非广告驱动的应用,从而减少对Google和Bing的依赖。
该项目还着眼于开发符合欧洲法规、价值观与文化的应用。例如,基于欧盟的搜索引擎和语言模型在处理非英语语种信息方面可能更为精准。同时,联盟正在深入研究网页爬取方式以及用户点击行为对排名机制的影响,以期提供更加精准、公正的搜索结果。
首次公开试验定于6月6日通过Zoom线上会议举行,参与者将有机会访问约1PB的网页内容。据透露,最终版本的Open Web Index预计将托管约5PB的内容,并计划在未来扩展至10PB的规模,为全球用户提供更加多元化、高质量的搜索选择。