AIPress.com.cn报道
12月29日消息,作为全球创意软件巨头,Adobe 正面临其首起重大的人工智能版权集体诉讼。根据加州联邦法院的案卷显示,作家 Elizabeth Lyon 指控 Adobe 在开发其 SlimLM(一种针对移动设备优化的轻量级语言模型)时,使用了未经授权的盗版书籍。
这一指控的核心在于数据溯源链的“污染”:SlimLM 是基于开源数据集 SlimPajama-627B 训练的,而该数据集被认为包含了臭名昭著的 Books3 库——一个拥有超过 19 万本盗版图书的非官方资源集。
此前,苹果(Apple)和 Salesforce 也曾因涉及类似的数据集而陷入法律纠纷,而 Anthropic 更是为此支付了高达 15 亿美元 的和解金。这表明,法律界正逐渐达成共识:AI 开发者必须对整个数据供应链的合规性负责,而不能以“开源”为由逃避责任。
此案对营销人员和内容创作者同样具有极高的警示意义。它揭示了生成式 AI 工具背后潜藏的“声誉风险”和“法律责任”。如果 AI 模型的底层数据本身是不合法的,那么使用该工具产出的商业内容可能面临潜在的版权追溯。
随着 2026 年 AI 监管力度的预期加强,企业在选择 AI 供应商时,必须要求对方提供清晰的 数据溯源证明(Data Provenance),并在合同中加入赔偿条款。Adobe 的这次法律阵痛,或许会倒逼整个行业从追求“大而快”的数据收集,转向建立更加透明、经得起审计的“清洁数据”生态。(AI普瑞斯编译)











