[新闻] AI与画家智财诉讼案例系列3：美国画家告M

时间Fri Mar 8 07:49:57 2024

战程序判决吞败原文网址: https://bit.ly/4c7EVwI 原文: 自ChatGPT崛起造就AIGC (AI Generated Content)的百花齐放，导致许多新创公司站在AI 浪尖上声名大噪，像Midjourney和Stability AI推出的稳定扩散(Stable Diffusion)图像生成（还有OpenAI的DALL-E），可让使用者以文生图、以图生图，自动产生媲美专业画家的图像，让Midjourney夯到不行，是目前业界顶尖的龙头代表。但也正因太火而产生智财争议诉讼，美国三位艺术家对Stability AI、DeviantArt和 Midjourney所开发之生成式AI工具，於2023年1月向北加州联邦地院提告着作侵权 [1]，而各被告都提出驳回原告起诉之动议（motion to dismiss，被告於案发初始阶段，主动要求法院直接驳回起诉，目的在省却旷日费时之冗长程序，如成功即可提早终结官司），业经法院於2023年10月底，做成中间判决性质之程序裁定。本刊前已介绍Stability AI和 DeviantArt部分，本文续对Midjourney进行分析。本案涉及之Midjourney产品 Midjourney公司总部位於旧金山，其於2022年7月推出的Midjourney产品，初期以测试版形式问世随後转型为商业产品。Midjourney的AI工具能根据文本提示(prompt)生成专业水准的图像。起初是在Discord社群建立机器人，随後快速转向商业应用，短短半年内吸引超过千万付费注册帐户，成为引人瞩目年营收达1亿美元的企业（但这家传奇性的公司正式员工仅11人）。原告声称，Midjourney产品是一款线上AI图像生成器，透过不同迭代版本使用稳定扩散技术，根据文本提示生成图像。目前版本是在图像子集上使用稳定扩散进行训练，该图像产生器以文本提示输入，生成数位图像输出，系完全依赖稳定扩散作为其生成图像的基础软体引擎，再向网路聊天系统Discord的线上使用者及透过应用程式之提供来收费。 Midjourney的执行长曾表示，该公司使用大型开放数据集，已「暗示」使用LAION数据集进行训练，2022年8月Midjourney发布使用稳定扩散之测试版。本案涉及之扩散技术原理原告起诉状指出，「扩散」(diffusion)是一种特定机器学习应用的模型技术，以软体生成与训练数据中图像相似之输出图像，该模型存储训练数据集中每个项目的压缩副本。此扩散技术系由史丹佛大学Jascha Sohl-Dickstein领导的一组研究人员於2015年发明，并在其论文中介绍「使用非平衡热力学(Nonequilibrium Thermodynamics)的深度非监督式学习 (Deep Unsupervised Learning)」，该技术可应用於任何类型的数据，但该论文是集中在数位图像之应用。扩散分二个阶段进行，第一阶段是摄取图像，并透过系列步骤逐渐向其添加更多杂讯（ noise即噪声，指看到的而非听到的东西，系混乱和无结构的随机波动(random fluctuations)），在每个步骤中，程式会添加噪声（addition of noise，即「加噪」）来改变图像；到最後一步骤，图像已经「扩散」成本质上随机式的噪声(random noise)。第二阶段与第一阶段相似但次序相反，透过众多步骤将特定图像变成噪声的过程後再回溯运行，亦即，将随机噪声以相反顺序应用这些步骤，随着逐渐去除噪声数据（denoises，即「去噪」），程式最终还原重新组合成该原来之图像。起诉状中摘自Sohl-Dickstein论文，使用螺旋图像作为训练数据说明扩散过程的二个阶段如下图。 https://imgur.com/a/9c0cd79 第一行（蓝色螺旋）从左到右读取，描绘扩散第一阶段，噪音逐渐添加到螺旋图像中(其未显示当中的每个步骤)。中间的图像显示扩散过程中途的螺旋，最右边的图像显示扩散过程结束- - 螺旋变成一随机噪声场域。第二行（红色螺旋）从右到左读取显示相反过程：随机噪声（最右边的图像）逐渐取消扩散，透过反转第一阶段学习步骤的次序来「去噪」。中间的图像显示中途点(halfway point)的去噪过程，第二行最左边的图像，显示去噪过程的最终结果：原始螺旋再次回复出现。原告指控被告之AI生成工具，即以上述运作方式复制其着作权图像来自动生成侵权图像。原告对Midjourney直接侵权之指控原告指控：Midjourney的订阅者可透过造访其Web应用程式，然而问题在於，它是依赖盗用艺术家创作之数百万张图像，并将这些图像用作训练图像，因此是从他人受着作权保护的作品中，重新混合组装和拼贴产生侵权图像。当被问及Midjourney如何使用数据集时， Midjourney的执行长仅回答：「这是网路上的一个大规模扫描，我们使用已发布的开放数据集进行训练。」原告针对Midjourney的直接侵权理论为： (1) 透过抓取（即复制）受保护的作品，用於为Midjourney产品训练图像所制作出图像，而构成直接侵权； (2) 透过发行包含训练图像压缩副本的稳定扩散，作为Midjourney产品的一部分而构成直接侵权； (3) 透过制作和发行Midjourney产品而构成直接侵权，该Midjourney产品本身就是侵权之衍生作品； (4) 生成并发行属於侵权衍生作品的输出图像。针对原告指控Midjourney工具训练数据集用来输出图像，包含接受训练之受着作权保护作品的压缩副本，但Midjourney反驳这是不合理而难以置信的，因为50亿张图像庞大，不可能被压缩到一个可执行的程式。针对第一个理论，与关於同案被告Stability AI在LAION 中的角色，以及Stability AI抓取然後在稳定扩散中，使用训练图像做联系的详细指控不同请参本刊：美国画家控告Stability AI生成式AI工具着作侵权之程序判决出炉，原告对於Midjourney为其品进行哪些训练，竟然并无任何事实之陈述。唯一提及的是Midjourney 首席执行官的评论，即Midjourney是使用开放数据集（原告假设这些数据集来自LAION），并且在这些数据集上进行训练。然而，原告宣称Midjourney所使用稳定扩散之方式，如：「稳定扩散已在多个程式中被用作软体库(software library)，包括Midjourney产品」；「作品是指用於训练任何稳定扩散版本的任何图像，该图像由被告直接提供或合并到另一个产品中」云云。北加州地院对直接侵权之程序裁定但法院认为以上说法，就原告究竟是基於Midjourney使用稳定扩散，还是基於Midjourney 自己独立使用训练图像来训练产品，还是二者兼而有之？其主张都太含混不明需要澄清。因此，法院认为原告对Midjourney的直接侵权指控不够清楚，原告也未提供事实说明 Midjourney对其AI平台进行哪些训练，因此在缺乏事实的情况下，法院无法确定 Midjourney是否不当使用原告受着作权保护的图像。另外，原告对Midjourney的衍生作品责任理论也有缺陷，原因与法院在讨论DeviantArt案时所指出的原因相同请参本刊：美国画家控告DeviantArt生成式AI着作侵权首轮程序判决被告占上风。据此，法院核准 Midjourney所声请驳回直接侵权的动议，但允许原告可予以修改(with leave to amend) 。法院进而表示，原告除应添加被告产品使用受着作权保护之压缩副本的事实外， Midjourney将来可能会对直接侵权主张进行更针对性的攻击。例如，不清楚的是，稳定扩散是否仅包括可应用於建立图像的演算法和指令，而这些图像只含有受着作权保护之训练图像的一小部分元素(a few elements)；当Midjourney仅透过其应用程式和网站，将稳定扩散作为「文库」(library)提供客户使用时，其为何需要负直接侵权之责？凡此种种法院都认为不确定。然而，法院并未完全排除原告可辩护这一指控的可能性，特别指出原告如能合理地主张，被告的AI产品可让使用者，透过引用原告姓名的作品来创作新作品，以及原告受保护的内容究竟系如何、以及有多少留在稳定扩散中被AI最终产品所使用的，则其立论可能会更坚强。原告对Midjourney代理侵权之指控原告指控，使用者透过被告AI图像工具，输入原告姓名後就会产生冒充艺术家原作的图像，这些使用者可谓是「冒名顶替者」，而其依赖艺术家的原作品，输入含有特定艺术家姓名的提示回应，所产生的冒充图像就是「伪造品」。因此，被告应知悉其AI工具的功能容易用来生成伪造品。冒名顶替者出售伪造品使原告因受损，因而被告从AI工具中，直接或间接地从冒名顶替者的侵权行为中获利，故其应对第三者的侵权行为，承担代理侵权 (vicarious infringement)责任。但法院认为，法律上要对代理侵权行为负着作侵权责任，原告必须指控被告（1）拥有监督侵权行为的权利和能力(right and ability to supervise)，以及（2）在侵权活动中获具有直接的经济利益。参Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)。但问题在於，本案原告针对三位被告之起诉，无分轩轾地将其看成一体、笼统指控其全都构成代理侵权，但具体上哪个被告基於第三人的何种行为，得以构成代理侵权却并未明确指出，且其起诉状中对不同被告间无区别的指控，常将三位被告混为一谈，难以厘清每个被告究竟谁实际从事何项确切行为，导致法律上可造成间接侵害，完全混淆不明。 Midjourney因而抗辩，原告指控其代理责任之主张应被驳回，因为依Sound & Color, LLC v. Smith案例，No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal. Feb. 28, 2023)，被告不能对自己的直接侵权，承担间接侵权中之次级责任(secondary liability)。因而，当使用被告的生成式AI产品构成侵权时，只有在对每个被告提出的直接侵权主张充分表达後，法院才能确定，原告是试图让被告对自己的直接侵权承担次级侵权之代理责任，还是让被告对他人使用其产品的直接侵权来负间接侵权之责，凡此，原告之主张都含糊不清应被驳回。北加州地院对代理侵权之程序裁定法院认为，原告基於「冒名顶替者」使用被告工具产生「伪造品」的代理侵权主张，还存有其他重要问题。因原告的诉状中未能指控，被告以原告作品制作出基於该作品实际存在的「伪造品」为何。反之，原告自己起诉状中还承认：「根据扩散过程的运作原理，一般而言，对於特定文本指令提示所回应产生由稳定扩散输出的图像，不太可能与训练数据中的任何特定图像相匹配而近似(close match)」。亦即原告无法举出被告AI工具，能生成任何「实际上」与其构成相同或近似的「伪造品。可见得，原告已不依赖具体作品之实质相似理论，只能转而攻击所有输出图像都是衍生侵权作品，然後再补充指控：被告输出图像与原告画作的「风格」(in the styles)或艺术认同(artistic identities)相似关於风格相似是否侵权请参本刊「Midjourney与Stability AI扩散模型自动生成引爆着作侵权疑云？-- 图形影像篇」，以至於亦构成「伪造品」。由於原告并未能对Midjourney提出充分之直接侵权的主张，而有待之後的修改，则法律上即无从对其提起代理侵权的主张，因为代理责任需要直接侵权行为存在做为基础。参见 Perfect 10, Inc. v. Yandex N.V., 962 F.Supp.2d 1146, 1158 (N.D. Cal. 2013), as amended (Sept. 6, 2013)。法院指出，由於原告未能释明被告AI平台，如何被第三方以侵权方式使用，以致该代理侵权之主张仍存有缺陷。因此，针对原告指控代理侵权之主张被法院驳回，但法官也网开一面，允许原告进行修正以澄清其理论。法院特别要求原告修正其理论时，针对这些副本如何在提供给第三方的Midjourney产品中，以违反着作权法保护权利的方式呈现、存在或引用，原告必须提供明确和合理的指控，叙明Midjourney对其产品被第三方使用而承担代理责任的情况。例如，就他人使用被告AI 工具生成伪造品时，被告为何因此会间接侵权而产生代理责任。此外，法院还提醒原告修改时，应列出每个被告就其所从事的行为详细陈述，而不能再将所有的「被告」混为一谈。此外，Midjourney在其动议声请中力争，不应允许原告就其依着作权法中，所规定的表演权之违反请求提出修正，因为在图画作品中不存在所谓之表演权，且原告在反对意见中未反对Midjourney之驳回声请。而庭审中，原告请求允许保留其表演侵权理论之指控，法院虽允许但也明示，在接下来可能的驳回动议中，法院将不会像在这一轮那样慷慨地允许修正，法院希望对每项指控及支持指控的每个被告行为，提供更具体的资讯。本案原告提交修改後之起诉状为回应法院的纠正，原告於2023年11月底提交修改的起诉状，但已和与原来起诉大相迳庭，增加七名新的个人原告和一名被告：Runway AI（另一家生成式AI工具公司），原告重新架构新的主张，删除着作代理侵权指控(vicarious copyright infringement claim)，代之以着作诱导侵权请求(inducement of copyright infringement claim)；还删除公开权(right of publicity)和不公平竞争之请求，并添加二项商标法《兰纳姆法Lanham Act 》请求 - - 虚假认可(false endorsement) [2]和替代理企业外观侵权(vicarious trade-dress infringement)。修改後的起诉书，还提供有关原告声称稳定扩散包含「压缩副本」或「受保护表达内容」的更多细节，并提供学术论文和Stability AI人员的引用，声称这些内容支持原告主张，即模型包含受着作权保护的表达。结论一 - - AI扩散模型对着作侵权认定带来新的挑战最後，就法院对本案三位被告所下的程序判决，总结一些观点。扩散模型在图像、视频和语音生成领域受到广泛应用，其技术原理如前述，就是将一副画慢慢透过高斯噪声(Gaussian noise)，逐步以添加杂讯方式消除该画面中的细节（即加噪），使原来清晰的图画一直拆解到最後变成纯噪声，而无法辨识原图案的情况，然後再逆向操作这种分解过程，由後向前回溯慢慢再透过去除杂讯方式（即降噪或去噪），逐渐导引还原为当初原始清晰的图案，运行这种反向操作过程，AI就会掌握所有杂讯的特徵，透过训练神经网络完全掌握画作中的所有相关数据，从而可任意自噪声中合成数据，画出任何所需要的图像，因为所有资讯特徵都已被AI提取而尽入其囊中。但也因此，所画出的东西可能会与原作不相同，但却又可能保留原画中一些风格上的相似，本案扩散模型的运用，就是产生看似不同但风格相近的图案，除了训练过程中进行之中间复制外，也会涉及着作权另二项核心议题 -- 1. 风格上相似是否可能构成实质相似而侵权；2. 此种扩散模型被告可否主张构成合理使用而不侵权。换言之，和传统着作侵权类型大相迳庭，因为AI运作下之生成创作，已产生新兴科技所带来前所未见的冲击，因此如何旧酒装新瓶是一大挑战，尚待法院进一步认定。然而对业界言，着作权法在被修改前，仍必须按照既有游戏规则，因此设计AI工具就不能出於侥幸，而应注意如何在过程中多布几道防线避免踩到侵权地雷。反过来看，如被告能针对新兴科技之应用，创造出符合公共利益促进人类福祉的「转化性的合理使用」(Transformative Fair Use)，依美国过去如第二巡回上诉法院Authors Guild v. Google, Inc.案、最高法院Google v. Oracle America案，仍可能豁免於侵权，但究竟是否可以构成，业者必须要有足够睿智来判断以免承担法律责任请参本刊「Midjourney与Stability AI扩散模型自动生成引爆着作侵权疑云？-- 图形影像篇」。结论二 - - 北加州地院连续二个AI官司原告都踢到铁板值得观察的是本案之後，同样北加州地院针对生成式AI的着作侵权案Kadrey, Silverman & Golden v. Meta Platforms, Inc.请参本刊：美国作家集体诉讼控告Meta生成式AI工具 LLaMA着作侵权之程序判决出炉，原告第一回合程序上也吃了败仗。这二案原告之所以首战皆铩羽而归，似乎犯了一些错误！例如着作权登记，一般作者可能不会每完成一件作品後都去登记，但当决定起诉时，此基本前提应妥善准备。本案三位原告的画作众多，但最终却只有其中一位的16幅画适格作为审理依据！其次，本案原告起诉状中虽洋洋洒洒，却未详细说明每一被告究竟何处又如何构成侵权？其具体行为如何？针对三位被告的侵权说明含混不清，由此可见，对他人起诉确不容易。本案程序判决中法院似想要厘清：被告可否区分为：参与抓取、复制和使用受着作权保护的作品，来训练AI模型的公司像Stability；以及将扩散模型程式整合到自己产品中，但却未参与抓取、复制经注册训练图像的公司像DeviantArt和Midjourney；抑或是该後二者也实际参与复制等行为（此皆待厘清）；再来则是，此三者法律上为何可能构成间接侵权，凡此种种，应是嗣後任何生成式AI侵权诉讼所必须面对的重要课题。最後要强调的是，AI新兴科技所衍生的侵权态样，和传统的型态虽有不同！但即便如此，传统诉讼所要求的举证方式，并不会因为是AI而有所改变。换言之，原告起诉必须具体说明被告究竟产出何种作品，侵害原告哪些着作的哪些内容，而且在原作和侵权品之间，需建构实质相似性，这是所有着作侵权案件的铁律，原告不应误以为在AI的浪潮下，可绕道避开这方面的举证！当然，如原告在起诉状中所提，被告生成式AI产出的图像，不会和原告原来画作相似，则原告只能将焦点置於训练过程中的大量复制行为，但此仍取决於最终生成结果是否属於合理使用，如肯定则该过程中的复制亦不构成侵权！ --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.145.192.245 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Patent/M.1709855400.A.BA9.html

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Patent 板

[新闻] AI与画家智财诉讼案例系列3：美国画家告M

热门看板

赞助商连结