当地时间周一,一场涉及多家科技巨头的法律诉讼在加州联邦法院拉开帷幕。六位作家联合发起诉讼,指控埃隆·马斯克旗下xAI、Anthropic、谷歌、OpenAI、meta以及Perplexity等公司未经授权使用受版权保护的书籍训练人工智能系统。
此次诉讼的核心争议在于,这些科技公司被指控将大量受版权保护的书籍内容输入其开发的大语言模型训练数据库。原告方认为,这种行为严重侵犯了作者的著作权,且未给予任何经济补偿。其中一位原告约翰·卡雷鲁曾因揭露硅谷血液检测公司Theranos的欺诈行为而闻名,其根据该事件撰写的《滴血成金》一书成为诉讼涉及的版权作品之一。
与其他同类案件不同的是,这六位作家选择单独提起诉讼,而非合并为集体诉讼。诉讼文件指出,集体诉讼机制往往使被告公司能够以较低成本一次性解决大量索赔,这实际上削弱了单个作者的权益。起诉书强调:"人工智能企业不应通过集体诉讼的漏洞,以极低代价化解数以万计的高额侵权索赔。"
诉讼材料特别提及今年8月Anthropic公司达成的15亿美元和解协议。当时该公司被指控盗用数百万本图书训练AI模型,最终与原告方达成和解。但新诉讼披露,参与该集体诉讼的作者每部被侵权作品仅获得约3000美元赔偿——仅为美国版权法规定最高赔偿额15万美元的2%。
截至目前,涉案的六家科技公司均未对诉讼作出公开回应。法律专家指出,这起案件可能引发对人工智能训练数据合法性的新一轮司法审查,特别是关于合理使用原则在机器学习领域的适用边界问题。随着生成式AI技术的快速发展,数据版权争议已成为全球科技领域最受关注的法律议题之一。





