ITBear旗下自媒体矩阵:

OpenAI被指非法用盗版书训练模型 删除数据集遭质疑或面临巨额赔偿

   时间:2025-12-03 20:33:48 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,一场由作家发起的集体诉讼迎来关键进展,美国法官作出裁定,要求人工智能公司OpenAI披露其删除两个盗版书籍数据集的内部沟通记录,这一决定或使案件走向发生重大改变。

该诉讼的核心争议在于,OpenAI被指控在训练其聊天机器人ChatGPT时非法使用了盗版书籍。案件的关键点聚焦于2022年ChatGPT发布前,OpenAI删除的两个名为“Books1”和“Books2”的重要数据集。

对于删除数据集的原因,OpenAI最初称是因这些数据集“未被使用”,但随后又试图将所有解释归为受“律师-客户特权”保护的机密内容。这种前后不一致的说法引发了原告方的强烈不满与质疑。

美国治安法官Ona Wang对OpenAI的这一做法予以严厉批评。她裁定,OpenAI不能先给出公开理由,如“未使用”,之后在受到质询时又声称该理由属于特权信息。法官认为,OpenAI的这种行为“令人难以置信”,并责令其在12月8日前,公开所有与删除数据集相关的内部通信,包括与内部律师的讨论内容,以及提及盗版书库LibGen的所有信息。OpenAI的内部律师也需在12月19日前接受质询。

若法院最终判定OpenAI存在“恶意侵权”行为,该公司可能面临巨额赔偿。依据美国版权法,对于恶意侵权的情况,每部被侵权作品的法定赔偿金额最高可达15万美元,按当前汇率约合106.2万元人民币。

法官Wang强调,OpenAI一方面声称自己“善意”行事,另一方面却试图隐瞒决策过程,这两种做法存在根本性矛盾。陪审团有权了解OpenAI所宣称的“善意”究竟基于哪些事实,而这些被隐藏的内部信息,正是判断其是否构成恶意侵权的关键依据。

法官Wang还特别指出,OpenAI在辩护过程中,对另一起针对AI公司Anthropic的判决进行了曲解,错误地声称“为训练大语言模型而下载盗版书籍是合法的”。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version