作者stpiknow (H)
看板Patent
标题[新闻] AI与画家智财诉讼案例系列3:美国画家告M
时间Fri Mar 8 07:49:57 2024
战程序判决吞败
原文网址:
https://bit.ly/4c7EVwI
原文:
自ChatGPT崛起造就AIGC (AI Generated Content)的百花齐放,导致许多新创公司站在AI
浪尖上声名大噪,像Midjourney和Stability AI推出的稳定扩散(Stable Diffusion)图像
生成(还有OpenAI的DALL-E),可让使用者以文生图、以图生图,自动产生媲美专业画家
的图像,让Midjourney夯到不行,是目前业界顶尖的龙头代表。
但也正因太火而产生智财争议诉讼,美国三位艺术家对Stability AI、DeviantArt和
Midjourney所开发之生成式AI工具,於2023年1月向北加州联邦地院提告着作侵权 [1],
而各被告都提出驳回原告起诉之动议(motion to dismiss,被告於案发初始阶段,主动
要求法院直接驳回起诉,目的在省却旷日费时之冗长程序,如成功即可提早终结官司),
业经法院於2023年10月底,做成中间判决性质之程序裁定。本刊前已介绍Stability AI和
DeviantArt部分,本文续对Midjourney进行分析。
本案涉及之Midjourney产品
Midjourney公司总部位於旧金山,其於2022年7月推出的Midjourney产品,初期以测试版
形式问世随後转型为商业产品。Midjourney的AI工具能根据文本提示(prompt)生成专业水
准的图像。起初是在Discord社群建立机器人,随後快速转向商业应用,短短半年内吸引
超过千万付费注册帐户,成为引人瞩目年营收达1亿美元的企业(但这家传奇性的公司正
式员工仅11人)。
原告声称,Midjourney产品是一款线上AI图像生成器,透过不同迭代版本使用稳定扩散技
术,根据文本提示生成图像。目前版本是在图像子集上使用稳定扩散进行训练,该图像产
生器以文本提示输入,生成数位图像输出,系完全依赖稳定扩散作为其生成图像的基础软
体引擎,再向网路聊天系统Discord的线上使用者及透过应用程式之提供来收费。
Midjourney的执行长曾表示,该公司使用大型开放数据集,已「暗示」使用LAION数据集
进行训练,2022年8月Midjourney发布使用稳定扩散之测试版。
本案涉及之扩散技术原理
原告起诉状指出,「扩散」(diffusion)是一种特定机器学习应用的模型技术,以软体生
成与训练数据中图像相似之输出图像,该模型存储训练数据集中每个项目的压缩副本。此
扩散技术系由史丹佛大学Jascha Sohl-Dickstein领导的一组研究人员於2015年发明,并
在其论文中介绍「使用非平衡热力学(Nonequilibrium Thermodynamics)的深度非监督式
学习 (Deep Unsupervised Learning)」,该技术可应用於任何类型的数据,但该论文是
集中在数位图像之应用。
扩散分二个阶段进行,第一阶段是摄取图像,并透过系列步骤逐渐向其添加更多杂讯(
noise即噪声,指看到的而非听到的东西,系混乱和无结构的随机波动(random
fluctuations)),在每个步骤中,程式会添加噪声(addition of noise,即「加噪」)
来改变图像;到最後一步骤,图像已经「扩散」成本质上随机式的噪声(random noise)。
第二阶段与第一阶段相似但次序相反,透过众多步骤将特定图像变成噪声的过程後再回溯
运行,亦即,将随机噪声以相反顺序应用这些步骤,随着逐渐去除噪声数据(denoises,
即「去噪」),程式最终还原重新组合成该原来之图像。起诉状中摘自Sohl-Dickstein论
文,使用螺旋图像作为训练数据说明扩散过程的二个阶段如下图。
https://imgur.com/a/9c0cd79
第一行(蓝色螺旋)从左到右读取,描绘扩散第一阶段,噪音逐渐添加到螺旋图像中(其
未显示当中的每个步骤)。中间的图像显示扩散过程中途的螺旋,最右边的图像显示扩散
过程结束- - 螺旋变成一随机噪声场域。
第二行(红色螺旋)从右到左读取显示相反过程:随机噪声(最右边的图像)逐渐取消扩
散,透过反转第一阶段学习步骤的次序来「去噪」。中间的图像显示中途点(halfway
point)的去噪过程,第二行最左边的图像,显示去噪过程的最终结果:原始螺旋再次回复
出现。
原告指控被告之AI生成工具,即以上述运作方式复制其着作权图像来自动生成侵权图像。
原告对Midjourney直接侵权之指控
原告指控:Midjourney的订阅者可透过造访其Web应用程式,然而问题在於,它是依赖盗
用艺术家创作之数百万张图像,并将这些图像用作训练图像,因此是从他人受着作权保护
的作品中,重新混合组装和拼贴产生侵权图像。当被问及Midjourney如何使用数据集时,
Midjourney的执行长仅回答:「这是网路上的一个大规模扫描,我们使用已发布的开放数
据集进行训练。」
原告针对Midjourney的直接侵权理论为:
(1) 透过抓取(即复制)受保护的作品,用於为Midjourney产品训练图像所制作出图像,
而构成直接侵权;
(2) 透过发行包含训练图像压缩副本的稳定扩散,作为Midjourney产品的一部分而构成直
接侵权;
(3) 透过制作和发行Midjourney产品而构成直接侵权,该Midjourney产品本身就是侵权之
衍生作品;
(4) 生成并发行属於侵权衍生作品的输出图像。
针对原告指控Midjourney工具训练数据集用来输出图像,包含接受训练之受着作权保护作
品的压缩副本,但Midjourney反驳这是不合理而难以置信的,因为50亿张图像庞大,不可
能被压缩到一个可执行的程式。针对第一个理论,与关於同案被告Stability AI在LAION
中的角色,以及Stability AI抓取然後在稳定扩散中,使用训练图像做联系的详细指控不
同请参本刊:美国画家控告Stability AI生成式AI工具着作侵权之程序判决出炉,原告对
於Midjourney为其品进行哪些训练,竟然并无任何事实之陈述。唯一提及的是Midjourney
首席执行官的评论,即Midjourney是使用开放数据集(原告假设这些数据集来自LAION)
,并且在这些数据集上进行训练。然而,原告宣称Midjourney所使用稳定扩散之方式,如
:「稳定扩散已在多个程式中被用作软体库(software library),包括Midjourney产品」
;「作品是指用於训练任何稳定扩散版本的任何图像,该图像由被告直接提供或合并到另
一个产品中」云云。
北加州地院对直接侵权之程序裁定
但法院认为以上说法,就原告究竟是基於Midjourney使用稳定扩散,还是基於Midjourney
自己独立使用训练图像来训练产品,还是二者兼而有之?其主张都太含混不明需要澄清。
因此,法院认为原告对Midjourney的直接侵权指控不够清楚,原告也未提供事实说明
Midjourney对其AI平台进行哪些训练,因此在缺乏事实的情况下,法院无法确定
Midjourney是否不当使用原告受着作权保护的图像。另外,原告对Midjourney的衍生作品
责任理论也有缺陷,原因与法院在讨论DeviantArt案时所指出的原因相同请参本刊:美国
画家控告DeviantArt生成式AI着作侵权首轮程序判决被告占上风。据此,法院核准
Midjourney所声请驳回直接侵权的动议,但允许原告可予以修改(with leave to amend)
。
法院进而表示,原告除应添加被告产品使用受着作权保护之压缩副本的事实外,
Midjourney将来可能会对直接侵权主张进行更针对性的攻击。例如,不清楚的是,稳定扩
散是否仅包括可应用於建立图像的演算法和指令,而这些图像只含有受着作权保护之训练
图像的一小部分元素(a few elements);当Midjourney仅透过其应用程式和网站,将稳定
扩散作为「文库」(library)提供客户使用时,其为何需要负直接侵权之责?凡此种种法
院都认为不确定。然而,法院并未完全排除原告可辩护这一指控的可能性,特别指出原告
如能合理地主张,被告的AI产品可让使用者,透过引用原告姓名的作品来创作新作品,以
及原告受保护的内容究竟系如何、以及有多少留在稳定扩散中被AI最终产品所使用的,则
其立论可能会更坚强。
原告对Midjourney代理侵权之指控
原告指控,使用者透过被告AI图像工具,输入原告姓名後就会产生冒充艺术家原作的图像
,这些使用者可谓是「冒名顶替者」,而其依赖艺术家的原作品,输入含有特定艺术家姓
名的提示回应,所产生的冒充图像就是「伪造品」。因此,被告应知悉其AI工具的功能容
易用来生成伪造品。冒名顶替者出售伪造品使原告因受损,因而被告从AI工具中,直接或
间接地从冒名顶替者的侵权行为中获利,故其应对第三者的侵权行为,承担代理侵权
(vicarious infringement)责任。
但法院认为,法律上要对代理侵权行为负着作侵权责任,原告必须指控被告(1)拥有监
督侵权行为的权利和能力(right and ability to supervise),以及(2)在侵权活动中
获具有直接的经济利益。参Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d
788, 802 (9th Cir. 2007)。但问题在於,本案原告针对三位被告之起诉,无分轩轾地将
其看成一体、笼统指控其全都构成代理侵权,但具体上哪个被告基於第三人的何种行为,
得以构成代理侵权却并未明确指出,且其起诉状中对不同被告间无区别的指控,常将三位
被告混为一谈,难以厘清每个被告究竟谁实际从事何项确切行为,导致法律上可造成间接
侵害,完全混淆不明。
Midjourney因而抗辩,原告指控其代理责任之主张应被驳回,因为依Sound & Color,
LLC v. Smith案例,No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal.
Feb. 28, 2023),被告不能对自己的直接侵权,承担间接侵权中之次级责任(secondary
liability)。因而,当使用被告的生成式AI产品构成侵权时,只有在对每个被告提出的直
接侵权主张充分表达後,法院才能确定,原告是试图让被告对自己的直接侵权承担次级侵
权之代理责任,还是让被告对他人使用其产品的直接侵权来负间接侵权之责,凡此,原告
之主张都含糊不清应被驳回。
北加州地院对代理侵权之程序裁定
法院认为,原告基於「冒名顶替者」使用被告工具产生「伪造品」的代理侵权主张,还存
有其他重要问题。因原告的诉状中未能指控,被告以原告作品制作出基於该作品实际存在
的「伪造品」为何。反之,原告自己起诉状中还承认:「根据扩散过程的运作原理,一般
而言,对於特定文本指令提示所回应产生由稳定扩散输出的图像,不太可能与训练数据中
的任何特定图像相匹配而近似(close match)」。亦即原告无法举出被告AI工具,能生成
任何「实际上」与其构成相同或近似的「伪造品。可见得,原告已不依赖具体作品之实质
相似理论,只能转而攻击所有输出图像都是衍生侵权作品,然後再补充指控:被告输出图
像与原告画作的「风格」(in the styles)或艺术认同(artistic identities)相似关於风
格相似是否侵权请参本刊「Midjourney与Stability AI扩散模型自动生成引爆着作侵权疑
云?-- 图形影像篇」,以至於亦构成「伪造品」。
由於原告并未能对Midjourney提出充分之直接侵权的主张,而有待之後的修改,则法律上
即无从对其提起代理侵权的主张,因为代理责任需要直接侵权行为存在做为基础。参见
Perfect 10, Inc. v. Yandex N.V., 962 F.Supp.2d 1146, 1158 (N.D. Cal. 2013),
as amended (Sept. 6, 2013)。法院指出,由於原告未能释明被告AI平台,如何被第三方
以侵权方式使用,以致该代理侵权之主张仍存有缺陷。因此,针对原告指控代理侵权之主
张被法院驳回,但法官也网开一面,允许原告进行修正以澄清其理论。
法院特别要求原告修正其理论时,针对这些副本如何在提供给第三方的Midjourney产品中
,以违反着作权法保护权利的方式呈现、存在或引用,原告必须提供明确和合理的指控,
叙明Midjourney对其产品被第三方使用而承担代理责任的情况。例如,就他人使用被告AI
工具生成伪造品时,被告为何因此会间接侵权而产生代理责任。此外,法院还提醒原告修
改时,应列出每个被告就其所从事的行为详细陈述,而不能再将所有的「被告」混为一谈
。
此外,Midjourney在其动议声请中力争,不应允许原告就其依着作权法中,所规定的表演
权之违反请求提出修正,因为在图画作品中不存在所谓之表演权,且原告在反对意见中未
反对Midjourney之驳回声请。而庭审中,原告请求允许保留其表演侵权理论之指控,法院
虽允许但也明示,在接下来可能的驳回动议中,法院将不会像在这一轮那样慷慨地允许修
正,法院希望对每项指控及支持指控的每个被告行为,提供更具体的资讯。
本案原告提交修改後之起诉状
为回应法院的纠正,原告於2023年11月底提交修改的起诉状,但已和与原来起诉大相迳庭
,增加七名新的个人原告和一名被告:Runway AI(另一家生成式AI工具公司),原告重
新架构新的主张,删除着作代理侵权指控(vicarious copyright infringement claim),
代之以着作诱导侵权请求(inducement of copyright infringement claim);还删除公开
权(right of publicity)和不公平竞争之请求,并添加二项商标法《兰纳姆法Lanham Act
》请求 - - 虚假认可(false endorsement) [2]和替代理企业外观侵权(vicarious
trade-dress infringement)。修改後的起诉书,还提供有关原告声称稳定扩散包含「压
缩副本」或「受保护表达内容」的更多细节,并提供学术论文和Stability AI人员的引用
,声称这些内容支持原告主张,即模型包含受着作权保护的表达。
结论一 - - AI扩散模型对着作侵权认定带来新的挑战
最後,就法院对本案三位被告所下的程序判决,总结一些观点。
扩散模型在图像、视频和语音生成领域受到广泛应用,其技术原理如前述,就是将一副画
慢慢透过高斯噪声(Gaussian noise),逐步以添加杂讯方式消除该画面中的细节(即加噪
),使原来清晰的图画一直拆解到最後变成纯噪声,而无法辨识原图案的情况,然後再逆
向操作这种分解过程,由後向前回溯慢慢再透过去除杂讯方式(即降噪或去噪),逐渐导
引还原为当初原始清晰的图案,运行这种反向操作过程,AI就会掌握所有杂讯的特徵,透
过训练神经网络完全掌握画作中的所有相关数据,从而可任意自噪声中合成数据,画出任
何所需要的图像,因为所有资讯特徵都已被AI提取而尽入其囊中。
但也因此,所画出的东西可能会与原作不相同,但却又可能保留原画中一些风格上的相似
,本案扩散模型的运用,就是产生看似不同但风格相近的图案,除了训练过程中进行之中
间复制外,也会涉及着作权另二项核心议题 -- 1. 风格上相似是否可能构成实质相似而
侵权;2. 此种扩散模型被告可否主张构成合理使用而不侵权。
换言之,和传统着作侵权类型大相迳庭,因为AI运作下之生成创作,已产生新兴科技所带
来前所未见的冲击,因此如何旧酒装新瓶是一大挑战,尚待法院进一步认定。然而对业界
言,着作权法在被修改前,仍必须按照既有游戏规则,因此设计AI工具就不能出於侥幸,
而应注意如何在过程中多布几道防线避免踩到侵权地雷。反过来看,如被告能针对新兴科
技之应用,创造出符合公共利益促进人类福祉的「转化性的合理使用」(Transformative
Fair Use),依美国过去如第二巡回上诉法院Authors Guild v. Google, Inc.案、最高法
院Google v. Oracle America案,仍可能豁免於侵权,但究竟是否可以构成,业者必须要
有足够睿智来判断以免承担法律责任请参本刊「Midjourney与Stability AI扩散模型自动
生成引爆着作侵权疑云?-- 图形影像篇」。
结论二 - - 北加州地院连续二个AI官司原告都踢到铁板
值得观察的是本案之後,同样北加州地院针对生成式AI的着作侵权案Kadrey, Silverman
& Golden v. Meta Platforms, Inc.请参本刊:美国作家集体诉讼控告Meta生成式AI工具
LLaMA着作侵权之程序判决出炉,原告第一回合程序上也吃了败仗。
这二案原告之所以首战皆铩羽而归,似乎犯了一些错误!例如着作权登记,一般作者可能
不会每完成一件作品後都去登记,但当决定起诉时,此基本前提应妥善准备。本案三位原
告的画作众多,但最终却只有其中一位的16幅画适格作为审理依据!其次,本案原告起诉
状中虽洋洋洒洒,却未详细说明每一被告究竟何处又如何构成侵权?其具体行为如何?针
对三位被告的侵权说明含混不清,由此可见,对他人起诉确不容易。
本案程序判决中法院似想要厘清:被告可否区分为:参与抓取、复制和使用受着作权保护
的作品,来训练AI模型的公司像Stability;以及将扩散模型程式整合到自己产品中,但
却未参与抓取、复制经注册训练图像的公司像DeviantArt和Midjourney;抑或是该後二者
也实际参与复制等行为(此皆待厘清);再来则是,此三者法律上为何可能构成间接侵权
,凡此种种,应是嗣後任何生成式AI侵权诉讼所必须面对的重要课题。
最後要强调的是,AI新兴科技所衍生的侵权态样,和传统的型态虽有不同!但即便如此,
传统诉讼所要求的举证方式,并不会因为是AI而有所改变。换言之,原告起诉必须具体说
明被告究竟产出何种作品,侵害原告哪些着作的哪些内容,而且在原作和侵权品之间,需
建构实质相似性,这是所有着作侵权案件的铁律,原告不应误以为在AI的浪潮下,可绕道
避开这方面的举证!当然,如原告在起诉状中所提,被告生成式AI产出的图像,不会和原
告原来画作相似,则原告只能将焦点置於训练过程中的大量复制行为,但此仍取决於最终
生成结果是否属於合理使用,如肯定则该过程中的复制亦不构成侵权!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.145.192.245 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Patent/M.1709855400.A.BA9.html