作者R2003 (费边)
看板LAW
标题[判决][美国] AI 合理使用 No. C 24-05417 WHA
时间Wed Jun 25 22:59:12 2025
※本人知悉此非我国判决,惟其法系承认先例之故,使本判决在当今与往後之AI时代有其
法学重要性,故主张[判决]应属合适分类且本文予以保留。
一、判决字号
美国加利福尼亚北区联邦地区法院 No. C 24-05417 WHA (着作权)(判决)
二、案件事实
Anthropic公司於训练其大语言模型(Large Language Model, LLM)Claude时,
1) 於网路上自盗版网站以电子形式免费下载数百万本仍受版权保护之书籍
2) 购买纸本书籍(部分与前项书目重复)且拆除其装订後,逐页扫描,
并以数位化、可搜索式之格式储存
前二项档案之建立与储存,旨在建立永久收藏全世界所有书籍的中央图书馆,
而Anthropic则按欲训练的LLM从此图书馆中选取适当的资料集、及其子集作为素材使用
三、争点(浓缩)
以上的任何行为是否有符合[美国]着作权法中,关於合理使用(Fair Use)的规范?
**本案两造皆未争执LLM模型之输出是否有侵害着作权,仅着重於训练(输入input)过程
四、法院见解(浓缩)
-------------------------
先提供原文判决书,连结取自Reuters
https://tmsnrt.rs/3ZL5jIx
另因其分析过程繁复,且不见得同我国法学,故不赘述,仅陈列结论与其立论根据
如欲知悉,请自行参阅上方档案
-------------------------
1. 将书籍用作训练LLM的行为,不逾越合理使用之范畴
- 转化性使用(transformative use),促进创新
2. 将购买之书籍电子化并储存於中央图书馆的行为,亦不逾越合理使用之范畴
- Anthropic在电子化购买书籍之过程,未有:
a) 创造新复本
**在於Anthropic於扫描後便销毁原购买之纸本,因此仅是变更储存方式
b) 产出新创作
c) 散布现存的任何复本/档案
3. 任何盗版资源的使用,与合理使用之规范显有抵触
五、
[强烈的]个人意见
我基本上同意本案法官的见解2、3,也同意见解1的论点,但对其欲达到该结论的路径
并连带引用见解2之储存加以证成的方法有意见。
本案法官将LLM训练过程类比於人类学习、创作的过程,认为储存这些资料好比人类
阅读後以记忆之方式保存;将这些资料用以训练就如同吾人创作时从过往记忆、参考资料
中撷取的行为。当吾人创作时显非
每次参考资料、回顾记忆便须向原出处提供一定金额作
为支付,LLM也因而不必如此,否则人类将难以有重大创新。
只不过LLM创作的历程真的与人类有相似性吗? 除非是天赋异禀,否则常人也无法记得
所有曾阅读过的资料、参与过的经历,而当无法回忆且无原有资料时,唯一的管道便是再
次花费(直接购买/间接透过图书馆)去取得资料,前者意味人类的创作有先天的时间限制,
因此每代人才有创作/创新的机会,後者则属非营利性/具备近用权。可LLM基本上不会有所
谓死亡的情况,且有营利性、低近用权的特徵。基於此,如果同意此LLM与人类学习、创作
有相似的见解,那在LLM影响愈来愈大的当今,长期之下恐将以人类普遍的创造能力做为
牺牲的代价,人类因而不用记忆,有事问LLM/AI。创新的可能性将属於小众/拥有未电子
化档案之人,减少了「刺激」的普遍,也就降低了创新的可能性,对人类的创新反而成为
阻碍,也就跟原先合理使用欲保障的目标有所矛盾。
总的来说,此种直接类比将造成
LLM对原着作权人的永久侵害,合理使用虽属合理,但
应再予以限缩。拙见是限缩至原初创建该模型之时,後续使用该素材的进一步优化模型都
不宜属合理使用,至於要如何切分,因其隐含的营利性特徵,或以首次对外上线使用较为
适宜。
另外,此案着重在LLM的前半,後半产出的部分并非所争,但本案法官在判决书中指出
纵使LLM训练过程尚属合理,不代表输出就没问题,并含蓄点到以本案证据来看,该LLM能
回避着作权侵害的原因在於模型公司并非实际让用户能直接使用LLM,而是透过辅助软体
将用户提示语进行过滤,以避免侵害着作权之内容生成,然後再透过辅助软体过滤掉生成
但可能侵害着作权内容之结果,最後才输出给用户。如此看来,那未来的AI争讼恐怕是跟
前端而非後端有关了,亦即产出之着作权侵害。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.14.42.0 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/LAW/M.1750863561.A.CFC.html
1F:→ R2003: 补充说明,本案在被告的声请下,从原本的着作权侵害缩限至 06/25 23:18
2F:→ R2003: 是否属合理使用,因此可能存在其他侵犯着作权的情况 06/25 23:20
※ 编辑: R2003 (39.14.42.0 台湾), 06/26/2025 04:38:42
3F:推 star1231: 很棒的分享 06/29 06:54