AI或成为版权法的终结者——兼评AI图片版权侵权案
作者:董文涛 2023-12-16近日,北京互联网法院(2023)京0491民初11279号案(以下简称“本案”)的民事判决书一经公开,便引起法律圈广泛关注,不少媒体称其为“国内AI图片版权侵权第一案”。其实,国内从未有过完整的司法裁判文书数据库,即便是曾经的“中国裁判文书网”也并未收录国内所有法院的所有裁判文书,因此,在报道宣传时应慎用“国内首例”“全国第一案”等不严谨表述。当然,这不是本文要讨论的。本文想要探讨的,甚至也不主要是本案的是非对错,而是借此引申开来,聊一聊AI已经给以及将来会给版权法律制度带来的影响。
一、AI会模糊版权法中的作品类型
本案中,原告利用Stable Diffusion软件,通过选取模型、输入提示词、设置参数等一系列操作生成了涉案图片,原告为它取了个很有诗意的名字“春风送来了温柔”(见下图)并发布在社交媒体账户中。原告主张,涉案图片属于美术作品,同时还提出了补充观点,即:若法院认定不构成美术作品,则原告主张其属于“符合作品特征的其他智力成果”。法院认为,涉案图片属于以线条、色彩构成的有审美意义的平面造型艺术作品,构成美术作品;既然已归属于版权法第三条前八项中的具体作品类型,就没有必要再适用第(九)项“符合作品特征的其他智力成果”。
其实,我们日常口语中使用的“图片”一词,通常对应版权法中的两类作品:一是美术作品,即绘画、书法、雕塑等以线条、色彩或者其他方式构成的有审美意义的平面或立体的造型艺术作品;二是摄影作品,即借助照相机、手机相机等器械在感光材料或者其他介质上记录客观物体形象的艺术作品。比如,因在公众号、网站等处使用图片,很多企业都有过被图片库公司起诉侵权的经历,这里的图片多为摄影作品。
应当说,在前AI时代,摄影作品与美术作品是泾渭分明的:摄影作品是“拍”出来的,美术作品是“画”出来的。尽管技艺精湛的超写实主义画家可以用素描、彩铅、水彩或油画等创作手法将绘画呈现地丝毫毕现、细致入微,以至于让人们惊呼“这居然不是照片,而是画出来的”,但这一现象并没有影响人们在生活中及在法律上对美术作品和摄影作品的认知与评价。毕竟,即使画得再像照片,它客观上也是艺术家“画”出来的,而不是用相机“拍”出来的。
然而,到了AI时代,AI生成的图片已经彻底模糊了摄影作品与美术作品的边界。比如,涉案图片“春风送来了温柔”,又如此前网络中广泛流传的由AI工具Midjourney生成的图片“中国情侣”(见下图)等等,在并未提前告知公众的情况下,人们大概率会认为它们是拍出来的照片,而不是AI“画”出来的图片。不仅如此,很多AI工具还可以将照片改造成创意类的绘画,或相反,将绘画改造成具有摄影效果的图片——无论哪种情况,人们几乎无从分辨究竟是照片还是绘画。
回到本案,笔者不揣冒昧,猜想原告是有点“心虚”的,原告似乎也意识到涉案图片既不是自己“拍”的,也不是自己“画”的,因此才提出了备位主张:若不构成美术作品,则应属“符合作品特征的其他智力成果”。可惜的是,对作品类型的问题,判决并未过多展开,仅做了简单化处理。但无论如何,我们必须承认,AI生成内容已经对版权法中的作品类型划分提出了挑战。
二、AI会异化版权法中的创作行为
随着ChatGPT等大模型横空出世,人类开启了生成式AI新篇章。AI可以像人一样聊天,还可以生成文本、图片、音频、视频、代码等内容。这些生成的内容,形式上很“像”作品,与文字作品、美术作品、摄影作品、音乐作品、视听作品及计算机软件等版权作品的外观无异。如果不提前告知,公众几乎无从分辨它们究竟是人创作的,还是AI生成的。
于是,大模型或AI产品的研发者,特别是AI产品的使用者,都可能认为是自己“创作”了这些内容,都有把AI生成内容的“版权”保护起来、据为己有的冲动。比如,腾讯公司Dreamwriter工具的研发团队曾试图通过诉讼主张该工具所生成文章的版权;再如,本案的原告及美国的克里斯蒂娜·卡什塔诺娃都属于AI使用者,他们分别通过版权诉讼和版权注册,试图保护自己利用AI工具生成的图片版权。
与本案原告的逻辑如出一辙,美国的卡什塔诺娃也认为,为了生成满意的图片,她向Midjourney发出了成百上千条指令,经Midjourney反复修改后才生成了最终图片,她认为自己输入的指令对于生成的图片属于“核心的创造性投入”。然而,北京互联网法院和美国版权局分别就本案原告及卡什塔诺娃的诉求给出了截然相反的答案。
北京互联网法院认为,原告对人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,且不断增加提示词、修改参数,体现了原告的审美选择和个性判断;况且,利用该模型,不同的人可以自行输入新的提示词、设置新的参数,生产不同的内容。因此,涉案图片并非“机械性劳动成果”,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达,满足了独创性要件。而美国版权局则认为,作为向Midjourney发出文字指令的用户,卡什塔诺娃既无法预测也无法控制Midjourney生成的内容,指令信息固然可以影响生成的内容,却无法决定特定的结果。因此,图片并非卡什塔诺娃以Midjourney为工具创作的结果,她也不能成为生成内容的作者。
笔者认为,AI生成内容无版权。用时髦的说法就是:AIGC无版权。
《著作权法实施条例》第三条规定:创作是指直接产生文学、艺术和科学作品的智力活动。为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作,均不视为创作。王迁教授进一步指出:强调“直接产生”,实际上是在强调民事主体决定构成作品所需表达性要素的自由意志,其与作品之间的联系如此紧密,以至于只能用“直接”而非“间接”予以描述。
根据王迁教授的观点,对作品的创作理念、风格、目标和方法等下达指令、进行指导、提出意见等,至多算是对构成作品的表达间接产生了影响,却不能直接决定构成作品的表达,作品的表达仍然是靠收到指令、指导或意见的主体(即作者)自行选择判断并以个性化的方式实现的。
同样,AI使用者通过指令、参数设置等固然可以对AI生成内容产生影响,但他并没有“直接”创作内容,他没有从事任何遣词造句(对文字作品而言)、勾勒描绘(对美术作品而言)、调焦构图按动快门(对摄影作品而言)、编排旋律(对音乐作品而言)等文学、艺术和科学作品的创作活动。本案判决中其实也承认,“原告并没有动笔去画具体的线条,甚至也没有百分之百地告知模型怎样去画出具体的线条和色彩,这与人们之前使用画笔、绘图软件去画图有很大的不同”。
如果因AI使用者的提示词及参数设置与众不同、具有一定独创性而认定生成内容有版权的话,无疑将违背“版权法仅保护表达而不保护思想”的基本原理。不可否认,涉案图片满足了美术作品或摄影作品的外观,甚至具有一定高度的艺术美感,但它并非由原告勾勒描绘而成,这一成果并非来自于或者并非主要来自于原告的贡献,原告的贡献是其输入的提示词及参数设置,而这些属于思想的范畴,类似于操作方法、工艺流程,并非版权法保护的客体。
总之,若本案的观点成为学理通说,或成为司法实务效仿的判例,那么,无疑会异化、扭曲版权法中“创作”的应有之义,进一步强化AI使用者认为自己“创作”了内容并试图保护其版权的误解与冲动。
三、AI会增加版权司法的成本
本案判决还提到,“利用人工智能生成图片,是否体现作者的个性化表达,需要个案判断,不能一概而论”;紧接着,在缕述了原告通过设定提示词、设置参数、反复修改生成涉案图片的全过程之后,判决得出了满足独创性要件的结论。
根据上述“需要个案判断,不能一概而论”的逻辑推演,该判决显然暗含了这样的观点,即AI生成图片可以分为两种:第一种是没有版权的“纯AI图片”。这类图片由AI自动生成,或由使用者在AI工具中输入相对简单的提示词、参数而机械地生成,无法达到独创性的高度;第二种是有版权的“半AI图片”。这类图片是使用者利用AI工具,通过较为复杂的提示词、参数及修改后生成的,可以体现使用者的审美选择和个性判断。
与笔者坚持的“AI生成内容无版权”的“一刀切”观点相比,本案判决所暗含的“AI生成内容有条件地纳入版权保护范围”的观点,虽看似更为中庸和稳妥,但其实更加危险。
若秉持本案判决的观点,无疑将会打开“AI生成内容版权侵权诉讼的潘多拉魔盒”。前文述及,由于AI生成的文本、图片等完全可以做到与文字作品、美术作品、摄影作品等版权作品的外观无异,因此,极有可能出现,或者说已经出现了这样的投机者:他们隐瞒自己使用AI工具生成文章或图片的事实,谎称自己创作了文章或图片,并且以此为权利基础提起维权诉讼,以牟取不当利益。
在这种情况下,一方面,版权权属证据的审查势必将成为版权司法的重中之重,沿用现行司法实践中“只要提供版权登记证书,就基本可以确定版权归属”的做法是不负责任的,法院恐怕需要首先查明“涉案内容到底是原告独创完成的,还是原告使用AI工具生成的”;另一方面,可以预见,涉及AI生成内容的版权侵权案件数量将大幅度增加,而疲惫的知识产权司法必将陷入“如果是原告使用AI工具生成的,那么,原告究竟使用了何种提示词及参数设置,以及这些提示词的选择、参数的设置有无独创性”的事实泥沼之中,案多人少、司法资源稀缺的残酷现实将被再次蒙上一层厚厚的阴影。要知道,不是所有的原告都如本案原告一样,坦率地承认涉案图片是其使用AI工具生成的;也不是所有的原告都如本案原告一样,在生成涉案图片的过程中竟然非常有心地全程留痕,保留了所有输入提示词、设置参数、反复修改的全过程视频。这类案件是如此的鸡零狗碎、微不足道,但是,法官想从案件事实的泥沼中艰难地爬出来,交出一份“事实认定清楚、适用法律正确”的判决答卷,要耗费多么大的司法成本?
四、AI会抑制作品产出和版权交易,并最终导致版权法消亡
格老秀斯说,即使上帝不存在,自然法也不会消失。从人类社会的很早期开始,金银、牛羊、土地等实体财产就成为社会财富的体现与衡量标准,所有权的观念如自然法一样顺理成章,不证自明。据传说记载,十六世纪的修道士Columba偷偷地将Abbot Finian所作的一首祷告文抄下来,Diarmid国王知道后立刻下令将抄本交还给Abbot:“对于每只母牛来说,它所生的小牛都是属于它的;而对每一本书来说,其手抄本也应该属于它的作者”。
在《安娜女王法》之前,在人类社会还没有版权法的时代,不是每个人都像Abbot那么幸运可以得到国王为他颁布的“法令”,绝大多数作者只能通过诉诸于社会道德获得心灵的慰藉,谴责剽窃这一道德准则很可能就源自于朴素的所有权观念。但是,有意思的是,在那样的时代里,即使没有版权法保护,无法获得基于版权法的财产收益,那些伟大的人类先贤仍然创作出了大量不朽的传世之作。或许,这可以从哲学层面作出解释:创作,这一始终伴随着人类历史的人类智力活动,是自我的、非理性的和非功利的,它是人的精神本能和生命力的组成部分。
因此,我们丝毫不会怀疑,在AI时代到来之际,即使每个人都可以使用AI工具生成外观与版权作品并无二致的文字、图片、音乐等内容,人类源于精神本能、发自内心、听从灵魂召唤的“良心之作”仍将层出不穷地出现。但是,我们又必须承认,由于人们可以轻易使用AI工具快速、高效地生成外观与版权作品并无二致的文字、图片、音乐等内容,这些内容不仅足以给人们带来愉悦、享受与思考,而且其文学性、艺术性等甚至可能远胜过大多数人绞尽脑汁、呕心沥血之作,此时,必然会大大抑制人类的创作欲望和作品产出。毕竟,人类是理性的,如果可以选择偷懒,很少人会选择不偷懒;如果可以走捷径,很少人会选择走弯路。
相比于对人类创作欲望的抑制,AI对版权交易、版权市场的抑制程度及力度可能会更大。以摄影作品的版权交易市场为例。号称全球最大的图片库公司、 曾经以出售摄影作品版权为主营业务的 Getty Images(它在中国的合作伙伴,就是大名鼎鼎的视觉中国)也不得不推出图像生成工具AI generator,开始拓展AI图片的生意。有外媒记者在该AI工具中输入提示词“背景稍微模糊的舞台,芭蕾舞演员展示阿拉贝斯克舞姿”后生成了一系列图片(见下图),当她将这些图片发送给朋友后,朋友们都认为是真实照片。试想,如果图片的消费者们可以利用Stable Diffusion、Midjourney等AI工具免费获得艺术性更高且无限接近照片的图片,消费者们就不会再愿意向 Getty Images支付版权许可费购买摄影作品,长此以往,摄影作品的版权交易市场就会逐渐消失。
与此类似的还有文字作品版权交易市场,它同样也受到了AI内容的巨大冲击。作者几乎无法或者很难证明小说究竟是自己的原创之作还是利用AI生成,又或者首先利用AI生成初稿又在此基础上修改而成的。而想要购买小说版权的影视公司则更是对此难以判断,于是,影视公司与其购买作家的小说版权,不如利用AI直接生成剧本并加以修改完善。可以想象,随着AI的进化及人们利用AI工具的技能提升,每个人都可以利用AI作曲作词、制作影片和撰写代码,音乐作品、视听作品、计算机软件等领域版权交易市场也会相继受到影响。人类的“良心之作”面对AI生成内容这一“竞品”,将会显得束手无策,传统的版权市场将不可避免地式微。
在版权法的早期,作品的形态是单一的,由一个人独立创作完成或少数人协作完成,而随着电影、软件等复杂作品出现,创作由个人创作向集体创作转变;在版权法的早期,作者的权利和利益形态也是单一的,以复制权和发行权为核心,以印刷、出版为主要利益来源,而当信息网络技术出现后,作品可以通过互联网更为便捷地、更为迅速地向更广范围传播,于是赋予作者信息网络传播便成为当时版权法的关切。可以说,版权法的历史就是一部作品类型和权利种类的扩张史,当新的作品形态、新技术催生新的作品使用方式出现,对原有作品形态、原有作品使用方式产生了冲击,并打破了既有的利益平衡后,版权制度便面临革新。
然而,与此前的新技术完全不同,AI的出现,不会使版权法再一次扩张做加法,反而会使版权法做减法,它会一定程度上抑制人类的创作欲望,降低人类作品的产出总量,甚至可能导致版权交易市场逐渐消亡。当人们的版权作品根本没有市场、无法形成实实在在的权益之际,版权法项下的复制权、发行权、信息网络传播权等财产权利都将形同虚设,一文不值。到那时,整个版权制度便会终结,人类的创作活动将回归本能的、纯粹的精神本色,而不再具有由版权法保障财产权益的功利与理性色彩。