美国社交媒体平台Reddit于当地时间22日向法院提起诉讼,将人工智能公司Perplexity及三家数据抓取企业列为被告。根据诉讼文件,Reddit指控Perplexity通过至少一家共同被告获取了未经授权的论坛数据,这些数据系通过谷歌搜索结果收集而来。
此前,Reddit已就AI训练数据使用问题与谷歌、OpenAI达成授权协议。今年7月,该平台曾以违规访问数据为由起诉另一家AI初创企业Anthropic。此次针对Perplexity的诉讼,进一步凸显了科技公司间关于数据获取的激烈博弈。
Reddit首席法律官本·李在声明中指出,当前人工智能领域正陷入一场争夺优质人类生成内容的“激烈竞争”。他强调,这种竞争压力催生了“大规模数据清洗”的灰色产业,而Reddit因其庞大的用户对话数据库成为主要目标。该平台自2005年成立以来,已积累数十亿条公开讨论记录,被视为全球最具活力的人类互动数据集之一。
面对指控,Perplexity发言人比约利·沙阿回应称,公司始终致力于维护用户“自由、公平获取公共知识”的权利。她强调,该公司的技术以负责任的原则运行,通过精准的人工智能提供事实性答案,坚决反对任何损害开放性和公共利益的行为。这场法律争端也引发了业界对AI训练数据合法性的持续关注。











