ITBear旗下自媒体矩阵:

Meta AI陷版权风波,Llama模型“吞下”哈利波特内容遭巨额索赔

   时间:2025-06-18 09:54:06 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

近期,一项涉及斯坦福大学、康奈尔大学及西弗吉尼亚大学研究人员的联合研究揭示了meta旗下Llama3.1 AI模型的一个惊人能力:它能够几乎一字不差地复制大量受版权保护的书籍内容。这一发现为meta带来了潜在的巨大法律风险。

据研究显示,Llama3.170B模型在测试中成功重现了《哈利波特:神秘的魔法石》近42%的文本,这一比例远超初代Llama模型的4.4%。这一发现引发了业界对AI模型版权边界的新一轮讨论。

OpenAI的ChatGPT和meta的Llama等AI模型通常通过大规模数据集进行训练,旨在识别并生成新的语言模式。然而,此次研究发现,Llama模型似乎并不仅限于学习语言模式,而是能够近乎“完整记忆”特定书籍,如《哈利波特》和《1984》。斯坦福大学的法律专家马克·莱姆利指出,若AI能够生成训练数据的完整摘录,那么它就不再被视为基于学习的“创新作品”,而更像是一个存储版权作品的“大型压缩包”,允许用户随意提取。

莱姆利的研究团队在测试多家公司的AI模型时,发现meta的Llama是唯一能够准确复述书籍内容的模型。除了《哈利波特》首部作品,Llama还展现了对《了不起的盖茨比》和《1984》等经典作品的显著记忆能力。

meta使用受版权保护材料训练AI的做法一直备受争议。目前,该公司正面临多起版权诉讼,其中包括知名作家(如喜剧演员莎拉·西尔弗曼)提起的诉讼,指控meta的模型基于非法获取的“Books3”数据集进行训练。该数据集包含近20万份受版权保护的出版物。法庭文件显示,一名meta工程师在下载种子文件时曾表达过不安。

莱姆利估计,如果“Books3”数据集中仅有3%的内容被认定为侵权,meta可能面临近10亿美元的法定赔偿。若侵权比例更高,其法律责任将更加沉重。值得注意的是,莱姆利曾代表meta在之前的生成式AI版权诉讼中进行辩护,但此次研究结果似乎改变了他的立场。今年早些时候,他宣布不再代理meta,以抗议该公司及其首席执行官马克·扎克伯格的某些行为。

对于莱姆利的最新研究发现,meta拒绝发表评论。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version