作者ides13 (juso)
看板Patent
标题[新闻] 自掏腰包买书训练AI合法吗?
时间Sun Jun 29 23:44:22 2025
心得:
买书训练AI「亮绿灯」:属合理使用范围
使用盗版材料训练仍违法
另外,法官裁定的「合理使用」仅限於训练模型,并没有解决AI输出内容是否侵权的问题
。
2025.06.25
|
自掏腰包买书训练AI合法吗?Anthropic获关键胜诉:「合理使用」原则是什麽?
https://www.bnext.com.tw/article/83694/claude-anthropic-fair-use
Anthropic被指控侵犯智慧财产权而诉讼缠身,不过近日法官开示,使用合法购买的书籍
训练AI属於「合理使用」范畴。
美国AI新创Anthropic去年遭到多位作家提起集体诉讼,指控该公司使用「盗版材料」训
练Claude AI模型。该诉讼还涉及Anthropic将购买来的书籍扫描建,档供AI训练的种种侵
权行为。
事实上,资料是训练AI不可或缺的资源,要在没有海量资料的前提下,通用人工智慧AGI
的愿景可以说遥不可及。也因此,包括OpenAI等AI巨头,无不花费大把资金与新闻、图库
等内容提供平台签约,以获得合法的资料进用权。
但现在的问题是,如果一家AI公司自掏腰包买下一堆书籍,并建档作为训练AI的资料,是
法律允许的吗?
买书训练AI「亮绿灯」:属合理使用范围
美国加州北区联邦法院针对上述问题做出关键裁定,法官威廉.奥尔萨普(William
Alsup)指出,如果Anthropic透过合法管道购买书籍训练AI模型,属於「合理使用」范畴
。
迈阿密大学法学院法律写作教授克里斯蒂娜.弗罗霍克(Christina Frohock)解释,法
院认为AI从版权材料中学习,就像 「你我拿起一本书阅读并形成自己的想法,这是合理
使用。」
法官奥尔萨普进一步阐述,着作权法的目的在於促进原创作品的创作,而不是为了保护作
者免受竞争,「作者们的抱怨,与他们抱怨训练儿童写作会导致竞争作品爆炸式增长,并
无不同。」
换言之,奥尔萨普认为 AI 模型的学习过程,与人类透过阅读学习、进而创作新作品的过
程,具有相似的本质。
值得一提的是,Meta在类似诉讼中也提出他们是「合理使用」,认为作者的指控应该被驳
回,不过尚不知负责该诉讼的法官,是否与这次Anthropic诉讼抱持相同的看法。
使用盗版材料训练仍违法
尽管 Anthropic 在「合法购买书籍训练 AI」的部分取得了胜利,但这项裁决并非全然对
其有利 。法官奥尔萨普同时指出,Anthropic 从「盗版」途径获取了超过700万本书籍,
并将这些盗版书籍存储在其「中央图书馆」,即使部份书籍未用於训练,不构成「合理使
用」。
这代表尽管购买市售书籍扫描用於训练虽然没问题,Anthropic 仍将面临一场独立的审判
,以厘清其使用盗版内容的法律责任以及可能造成的损害赔偿。 另外,法官裁定的「合
理使用」仅限於训练模型,并没有解决AI输出内容是否侵权的问题。
Anthropic发言人向媒体表示,「与版权促进创造力和科学进步的宗旨相同,Anthropic的
大型语言模型以作品作为训练对象,并非为了赶上、复制或取代它们,而是为了突破困境
、创造出与众不同的东西。」
不过,Anthropic表示他们并不同意将有另一场独立审判的决定,但对诉讼整体仍然抱持
信心。
近年来,为了避免类似的争议,AI公司开始主动与媒体、内容产业合作获得使用授权,例
如OpenAI已经与新闻集团、华盛顿邮报、Shutterstock等公司达成合作;Google也与社群
平台Reddit合作,以取得平台上的内容。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.34.124.93 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Patent/M.1751211865.A.AF0.html
1F:推 DivineSwine: claude确实需要多训练 在另一个anthropic的诉讼案中 07/01 03:05
2F:→ DivineSwine: 差点搞出制造假引证案的乌龙 07/01 03:06