Stable Diffusion人工智能模型许可证 CreativeML Open RAIL-M/++-M合规探析
作者:丁华 黄威 陈岱源 2024-05-11一、人工智能开源大模型Stable Diffusion简介
在人工智能绘图领域,有两大龙头产品,分别是Midjourney和Stable Diffusion。Midjourney采取的是付费订阅的商业模式,按月向用户收取费用,Stable Diffusion则采用开源模式,Stable Diffusion的第一代和第二代均在开源社区公布模型的权重和源代码,从而促进非商业性的使用,另外,Stable Diffusion还通过付费会员(Stability AI Membership)的方式提供商业使用的授权,目前Stability AI Membership的商业使用会员费用为20美元/每月,企业用户还可以按需求定制[①]。
Stable Diffusion幕后的运营公司以Stability AI公司最为知名,该公司成立于2019年,旨在实现人工智能的民主化(AI for the people, by the people),打造激活人类潜能的全球性基础。目前,Stability AI已经在全球建立了一个拥有三十多万创作者、开发者和研究人员的人工智能社区。Stable Diffusion一经发布即在全球获得了1000万个用户,其目前在在Discord的用户已达27万人,全球用户通过使用Stability AI的API累计生成了4亿张图片[②]。
Stable Diffusion的技术原理发布在慕尼黑大学的CompVis研究团体、海德堡大学以及AI视频剪辑技术创业公司Runway的一篇名为《High-Resolution Image Synthesis with Latent Diffusion Models》论文中,而名为Stability AI的公司则为研究团队提供了算力资源,双方合作训练出了Stable Diffusion的第一个版本。因此,目前Stable Diffusion的第一个版本以慕尼黑大学CompVis研究团体的名义发布在Github[③]和Hugging Face上。在Hugging Face上以CompVis的名义发布有1-1及1-1-original、1-2及1-2-original、1-3及1-3-original、1-4及1-4-original共8个版本,分别对应不同的库(Diffusers或CompVis)和训练方式[④]。另外,Stable Diffusion的最初合作研发者Runway也以自己的名义发布了1-5版本[⑤]。
以上版本可以统称为Stable Diffusion v1,它们都采用The CreativeML OpenRAIL M license许可证发布,并且模型卡中说明“预期仅用于研究目的”(“The model is intended for research purposes only.”)[⑥]。它们的版权信息均显示:“Copyright (c) 2022 Robin Rombach and Patrick Esser and contributors”。
2022年,曾经为Stable Diffusion的最初版本提供算力支持的公司Stability AI同样在Stable Diffusion v1的基础上独自开发Stable Diffusion的新版本。2022年11月,Stability AI发布了Stable Diffusion v2,2022年12月,发布了Stable Diffusion v2.1,2023年3月,发布了Stable unCLIP 2.1,它们均采用CreativeML Open RAIL++-M License许可证来许可模型参数和权重,采用MIT许可证来许可源代码[⑦]。
上述由Stability AI发布的各个版本的模型,其版权信息均显示:“Copyright (c) 2022 Stability AI and contributors”或“Copyright (c) 2022 Stability AI”[⑧],并且在模型卡中也说明:预期仅用于研究目的(The model is intended for research purposes only)。
2023年7月Stability AI还发布了Stable Diffusion XL 1.0,在2023年11月发布了Stable Diffusion XL Turbo。其中,Stable Diffusion XL Turbo不再采用Creative ML OpenRAIL许可证,而是采用Stability AI自行制定的STABILITY AI NON-COMMERCIAL RESEARCH COMMUNITY LICENSE AGREEMENT许可证。在模型卡中,Stability AI指出该许可证只授权非商业性使用,如果需要商业性使用的,则需要额外取得许可[⑨]。
根据Stability AI的官网显示,目前Stable Diffusion 3已经可以通过Stability AI 开发者平台使用[⑩],具体开源发布日期还未确定。
二、人工智能开源大模型Stable Diffusion v1和v2模型许可证CreativeML Open RAIL-M和CreativeML Open RAIL++-M简介
(一)Stable Diffusion v1许可证CreativeML Open RAIL-M简介
如前所述,在Huggingface上Stable Diffusion v1有5个版本(V1-1、V1-2、V1-3、V1-4和 V1-5,其中前四个版本由CompVis 发布,1-5由Runway发布),Stable Diffusion v1的5个版本的版权声明为版权归属Robin Rombach和Patrick Esser 及贡献者。Stable Diffusion v1的5个版本均适用CreativeML Open RAIL-M许可证。
Stable Diffusion v1所采用的CreativeML Open RAIL-M许可证版本为2022 年8月22日版[⑪],许可证内容包括4节12个条款和附件A,主要内容如下:
第一节序言 首先CreativeML Open RAIL-M的发布者在序言说明,相信开放和负责任的人工智能开发之间存在交集,因此,CreativeML Open RAIL-M许可证努力实现两者之间的平衡,并希望通过采用的CreativeML Open RAIL-M许可证同时实现模型的开放和负责任的下游使用。序言部分还对模型许可涉及的重要概念在第1条进行了定义,例如:
数据是指从数据集提取的信息和/或内容的集合和模型一起使用,包括为了训练、预训练或以其他方式评估模型。数据未根据CreativeML Open RAIL-M进行许可。模型是指任何随附的基于机器学习的组合(包括检查点),由学习的权重、参数(包括优化器状态)组成,与补充材料中体现的模型架构相对应,该组合通过使用补充材料利用全部或部分数据进行了训练或调整。模型的衍生作品是指对模型的所有修改,基于模型的作品,或通过将模型的权重、参数、激活或模型输出的模式转移到另一个模型来创建或初始化的任何其他模型,以使其他模型与该模型具有相似的性能,包括但不限于需要使用中间数据表示的蒸馏方法或基于该模型为训练其他模型生成的合成数据的方法。补充材料是指用于定义、运行、加载、基准检测或评估模型的附随源代码和脚本,和用于准备训练或评估数据的适用源代码和脚本,包括任何随附的文档、使用说明、示例等。输出是指运行模型的结果,体现为由此产生的信息内容。贡献系指版权人或被授权以版权人名义提交的个人或法律实体有意提交给许可人以纳入模型的任何作者作品,包括模型的原始版本以及对该模型或其衍生作品的任何修改或添加。
第二节知识产权 首先,CreativeML Open RAIL-M许可证明确规定其对版权和专利的授权适用于模型、模型的衍生作品和补充材料。模型和模型的衍作生品还受第III节中所述的附加条款的约束。其次,许可证第2条明确授予被许可人永久的、全球性的、非排他性的、不收费的、免版税的、不可撤销的版权许可,用于再制造、准备、公开展示、公开执行、可分许可和分发补充材料、模型和模型的衍生作品。再次,许可证第3条明确授予被许可人永久的、全球性的、非排他性的、不收费的、免版税的、不可撤销的(许可证另有规定除外)的专利许可,用于制造、委托制造、使用、许诺销售、销售、进口和以其他方式转移模型和补充材料。最后,许可证第3条规定,如果被许可人针对任何实体提起专利诉讼(包括诉讼中的交叉请求或反请求),声称模型和/或补充材料,或合并进模型和/或补充材料中的贡献构成直接或间接专利侵权,则根据本许可证授予专利许可自此类诉讼被主张或提起之日起终止。
第三节使用、分发和再分发的条件 首先,许可证第4条规定,被许可人可为第三方远程访问目的提供托管(例如软件即服务),在任何媒体上复制和分发模型或模型的衍生作品的副本,无论是否修改,前提是满足以下条件:(1)将许可证第5段的使用限制囊括进管辖模型或模型衍生作品的法律协议(例如许可证)中,但本条要求不适用于补充材料的使用;(2)必须向模型或模型衍生作品的任何第三方接收者提供一份CreativeML Open RAIL-M许可证的副本;(3) 使任何修改的文件带有显著的通知,声明该文件被修改;(4)保留所有版权、专利、商标和归属声明,但不包括与模型、模型衍生作品的任何部分无关的声明:(5)被许可人可以在其修改中添加其自己的版权声明,并可以提供附加的或不同的许可条款和条件,但前提是使用、复制和分发模型符合CreativeML Open RAIL-M许可证中规定的条件。其次许可证第5条规定,附件 A 中规定的限制被视为“基于使用行为的限制”。因此,被许可人不能为特殊规定的限制用途使用模型和模型的衍生作品。最后,许可证第6条规定许可人对被许可人使用模型生成的输出不主张任何权利。被许可人对生成的输出及其后续使用负有责任。对输出的任何使用均不能违反许可证中陈述的任何条款。
第四节其他规定 许可证第7条规定,在法律允许的最大范围内,许可人保留限制(远程或其他方式)违反许可证的模型使用行为、通过电子方式更新模型或基于更新修改模型输出的权利。被许可人还应尽合理努力使用最新版本的模型。许可证第8条规定,不允许被许可人使用许可人的商标、商号、标识或以其他方式错误陈述双方之间的关系。许可证第9条和第10条规定了无担保和责任限制声明。许可证第11条规定,在重新分发模型、模型的衍生作品和补充材料时,被许可人可以选择收取费用并提供同意支持、担保、补偿或与本许可证一致的其他责任义务和/或权利。但是,在接受此类义务时,被许可人只能代表被许可人自己并独自承担责任,而不是代表任何其他贡献者,并且被许可人同意补偿、抗辩并使每个贡献者免受由此可能导致损害。许可证第12条是可分割性条款,即如果本许可的任何条款被认定为无效、非法或不可执行,则其余条款不受影响,并继续有效。
附件A使用限制 附件A作为第5条的援引内容对模型或模型衍生作品(不包括补充材料)的使用限制进行了规定。模型或模型衍生作品的使用限制包括:以任何方式违反任何适用的国家、联邦、州、地方或国际法律或法规;通过任何方式剥削、伤害或试图剥削或伤害未成年人;为伤害他人的目的生成或传播可验证的虚假信息和/或内容;生成或传播可用于伤害个人的个人身份识别信息;诽谤、贬低或以其他方式骚扰他人;用于全自动决策,该决策对于对个人合法权利产生不利影响或以其他方式产生或修改具有约束力、可执行义务的;基于已知或预测的在线或离线社交行为个人或人格特征,意图或具有歧视或伤害个人或群体效果的任何使用;利用特定群体基于其年龄、社会、身体或精神特征的任何脆弱性,通过导致或可能导致该个人或另一个人身体和心理伤害的方式,对属于该群体的个人的行为进行实质性扭曲;基于受法律保护的特征或类别,意图或具有歧视个人或群体的任何使用;提供医疗建议和医疗结果解释;生成或传播用于司法管理、法律执行、移民或庇护程序的信息,例如预测个人将实施欺诈/犯罪(例如通过文本摘要、在文件中的声明之间得出因果关系、不加区分和任意有针对性的使用)。
(二)Stable Diffusion v2许可证CreativeML Open RAIL++-M简介
Stable Diffusion v2版本(包括2-base和2-1等)由StabilityAI发布。Stable Diffusion v2版本的版权声明标明,Stable Diffusion v2的完成时间为2022年,版权人为Stability AI及其贡献者[⑫]。
StabilityAI发布的Stable Diffusion v2版本的许可证分为两个部分,其开源代码文件适用MIT开源许可证[⑬]。MIT许可证是被最广泛采用的开源软件许可证之一。MIT许可证共四款内容:第一款是版权声明;第二款是授予许可,免费授予许可,任何获得软件的副本的人,无限制地处理该软件,包括但不限于,使用、复制、修改、合并、发布、分发、再许可和/或销售软件的副本,并且许可接收到本软件的人同样享有以上权利,前提是符合下面第三款规定的条件:第三款是获得许可需要满足条件,即版权声明和许可声明应包括在本软件的所有的副本或重要部分中。第四款是无担保并免责的声明。
StabilityAI发布的Stable Diffusion v2版本模型参数文件适用的是CreativeML Open RAIL++-M许可证[⑭]。
Stable Diffusion v2使用的CreativeML Open RAIL++-M许可证为2022 年11 月 24 日版本,许可证内容包括4节12个条款和附件A。CreativeML Open RAIL++-M许可证是在CreativeML Open RAIL-M许可证基础上修订而产生,除第7条内容有差异外(注:CreativeML Open RAIL++-M第7条删除了CreativeML Open RAIL-M 第7条中“被许可人还应尽合理努力使用最新版本的模型”的要求),CreativeML Open RAIL++-M许可证和CreativeML Open RAIL-M许可证条款及附件A均相同,具体条款内容可参考前文介绍。
三、人工智能开源大模型Stable Diffusion许可证合规需要关注的问题
根据前文对Stable Diffusion模型许可证CreativeML Open RAIL-M和CreativeML Open RAIL++-M内容的简要介绍,商业公司在合规使用和分发人工智能开源大模型Stable Diffusion v1和v2时应当关注如下问题。
(一)CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证许可专利和版权范围包括模型、模型衍生作品和补充材料(即代码文件及其文档)
CreativeML Open RAIL-M和CreativeML Open RAIL++-M两个模型许可证均发布于2022年同2023年发布的AIPubs Open RAIL-M许可证比较,相同之处在于,三个许可证均规定用于训练、评估的数据未根据前述模型许可证进行许可;不同之处在于,CreativeML Open RAIL-M和CreativeML Open RAIL++-M同时适用于模型(即模型参数权重文件)和补充材料(模型源代码及其文档),而AIPubs Open RAIL-M许可证明确规定,补充材料未根据AIPubs Open RAIL-M许可证进行许可。
因此商业公司在部署、使用和分发人工智能开源大模型Stable Diffusion v1和v2时,应清楚CreativeML Open RAIL-M、CreativeML Open RAIL++-M的许可版权和专利的范围包括模型、模型衍生作品和补充材料(即代码文件及其文档)。在此基础上商业公司还应当注意,虽然模型参数文件和补充材料(即代码文件及其文档)相关的版权和专利根据CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第2条进行许可,但CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第4条的规定的被许可人需要满足的对应条件仅为复制、分发和提供远程访问“模型和模型衍生作品”时需要满足的条件,而不包括“补充材料”,并且第5条及附件A的使用限制仅适用于“模型及其衍生作品”,同样并不适用于“补充材料”。
另外还需要注意的是,Stable Diffusion v1的补充材料(及模型源代码文件和相关文档)仅根据CreativeML Open RAIL-M进行许可,不涉及其他开源软件许可证,而Stable Diffusion v2的补充材料(及模型源代码文件和相关文档)事实上同时根据开源软件MIT许可证和CreativeML Open RAIL++-M许可证进行许可。
(二)模型权利人根据CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证对被许可人的授权范围包括版权和专利权,但不包括商标和商号权。
CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第2条明确授予被许可人永久的、全球性的、非排他性的、不收费的、免版税的、不可撤销的版权许可,用于再制造、准备、公开展示、公开执行、可分许可和分发补充材料、模型和模型的衍生作品。CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第3条明确授予被许可人永久的、全球性的、非排他性的、不收费的、免版税的、不可撤销的(许可证另有规定除外)的专利许可,用于制造、委托制造、使用、许诺销售、销售、进口和以其他方式转移模型和补充材料。
CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第8条规定,不允许被许可人使用许可人的商标、商号、标识或以其他方式错误陈述双方之间的关系。
(三)特别关注开源大模型Stable Diffusion v1适用的CreativeML Open RAIL-M许可证第7条规定的“被许可人还应尽合理努力使用最新版本的模型”的要求
商业公司在合规使用和分发人工智能开源大模型Stable Diffusion v1时应当特别关注CreativeML Open RAIL-M第7条规定的“被许可人还应尽合理努力使用最新版本的模型”的要求。
该要求被公众诟病,因为如果商业公司在开源大模型Stable Diffusion v1基础上进一步投入数据和算力对模型进行了微调,并将微调后的模型用于商业服务。此后Stable Diffusion v2发布,前述商业公司是否应当放弃之前投入成本微调后的Stable Diffusion v1模型,而采用新的Stable Diffusion v2,并再次投入成本对Stable Diffusion v2进行微调?如果商业公司在Stable Diffusion v2发布后,继续使用微调后的Stable Diffusion v1模型,是否违反了CreativeML Open RAIL-M第7条规定的“被许可人还应尽合理努力使用最新版本的模型”的要求?以上问题可能会困扰模型的使用者。
所幸Stable Diffusion v2发布时采用了CreativeML Open RAIL++-M许可证,在CreativeML Open RAIL++-M第7条中删除了CreativeML Open RAIL-M第7条规定的“被许可人还应尽合理努力使用最新版本的模型”的要求。
(四)被许可人对Stable Diffusion修改形成的派生作品,且无强制开源义务
CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第4条规定,被许可人为第三方远程访问目的提供托管(例如软件即服务),在任何媒体上再制造和分发模型或模型的衍生作品的副本,无论是否修改,所需要满足的条件中,并不要求后续使用者对基于开源人工智能大模型进行修改得到的派生作品继续进行开源/开放,因此被许可人对修改Stable Diffusion获得的派生作品,有权决定是否继续开源/开放其修改后的Stable Diffusion派生作品。
(五)被许可人用模型为用户提供远程访问、再制造和分发模型或模型的衍生作品的副本(无论是否修改),需遵守CreativeML Open RAIL-M和CreativeML Open RAIL++-M第5条及附件A的使用限制
被许可人用模型为用户提供远程访问、再制造和分发模型或模型的衍生作品的副本(无论是否修改),需遵守CreativeML Open RAIL-M和CreativeML Open RAIL++-M第5条和附件A的使用限制。
CreativeML Open RAIL-M和CreativeML Open RAIL++-M的附件A规定了9类使用限制,限制的类别和通用的AI Open RAIL许可证的使用限制相似,也可以大致分为违法、伤害和歧视和不符合透明度三类。
(六)Stable Diffusion研究用途限制问题
CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证均没有Stable Diffusion仅用于研究用途,不能用于商业用途的限制条款。
但在Stable Diffusion v1和v2的模型卡(MODEL CARD)中规定,Stable Diffusion模型预期仅用于研究目的,对该表述可能会使模型的使用者认为Stable Diffusion模型不能用于商业目的。但是,模型卡(MODEL CARD)中同样有 “误用、恶意使用和超出范围使用”的反向举例,在反向举例中并未提及禁止将Stable Diffusion v1和v2用于商业用途。
考虑到CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证均没有规定Stable Diffusion仅用于研究用途,不能用于商业用途的限制条款,且在Stable Diffusion v1和v2的模型卡“误用、恶意使用和超出范围使用”的反向举例中未提及禁止将Stable Diffusion v1和v2用于商业用途,另外,在CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证第6条规定许可人对被许可人使用模型生成的输出不主张任何权利。被许可人对生成的输出及其后续使用负有责任等种种因素,笔者倾向于认为Stable Diffusion v1和v2的模型卡中关于“Stable Diffusion该模型预期仅用于研究目的”的说明应当是从免责角度所作的声明,而非从法律角度禁止将Stable Diffusion v1和v2用于研究以外的商业用途。
最后需要提醒注意的是,并非所有StabilityAI发布的模型都适用CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证,例如,StabilityAI2023年发布的stable diffusion xl-turbo就适用了其他的许可方式(包括非商业用途许可和商业用途许可),如果商业公司再制造或分发这些模型用于商业用途则需要另行获得商业许可,而非通过CreativeML Open RAIL-M和CreativeML Open RAIL++-M许可证获得许可。
注释
[①] 参见Stability AI官网,https://stability.ai/membership。
[②] 参见Stability AI官网,https://stability.ai/about。
[③] 参见https://github.com/CompVis/stable-diffusion?tab=readme-ov-file。
[④] CompVis位于Hugging Face平台的模型仓库详见https://huggingface.co/CompVis。
[⑤] Runway是一家美国的人工智能公司,Stable Diffusion 1-5位于Hugging Face平台的模型仓库详见https://huggingface.co/runwayml/stable-diffusion-v1-5。对于Stable Diffusion 1-5的发布,曾经产生过知识产权方面的争议,Stability AI认为1-5版本的提前发布侵犯了Stability AI的知识产权,并向Hugging Face申请下架1-5,但经过Runwau的回应以及舆论的发酵后,Stability AI撤回了下架申请,详见https://36kr.com/p/1973794294424195。
[⑥] Stable Diffusion的第一个版本是面向研究者发布的,但是Stable AI 公司随后就在其公司的官网发布了Stable Diffusion的发布新闻,并且声称“模型以Creative ML OpenRAIL-M 许可发布,这是一种允许商业和非商业使用的许可”,笔者认为,Stability AI 并非Stable Diffusion的著作权人,其阐述的是其对许可证的单方面的理解,不应具有参考性。https://stability.ai/news/stable-diffusion-public-release
[⑦] Stable Diffusion v2位于Hugging Face的模型卡中介绍Stable Diffusion v2的base模型位于Github仓库,通过访问该仓库,可见Stability AI发布于Github的Stable Diffusion Version 2的源代码采用MIT许可证,版权信息为Copyright (c) 2022 Stability AI。参见https://github.com/Stability-AI/stablediffusion?tab=MIT-1-ov-file。Stable Diffusion v2.1与Stable unCLIP 2.1亦存在上述情况。
[⑧] 在模型许可证中,copyright声明显示为Copyright (c) 2022 Stability AI and contributors,在模型源代码的许可证中,copyright声明显示为Copyright (c) 2022 Stability AI。https://github.com/Stability-AI/stablediffusion/blob/main/LICENSE。
[⑨] 参见Stable Diffusion XL Turbo位于Hugging Face的模型卡,Please note: For commercial use, please refer to https://stability.ai/membership.,https://huggingface.co/stabilityai/sdxl-turbo。
[⑩] 参见https://stability.ai/stable-image。
[⑪] 许可证的原文详见https://huggingface.co/spaces/CompVis/stable-diffusion-license。
[⑫]参见https://huggingface.co/stabilityai/stable-diffusion-2/blob/main/LICENSE-MODEL
[⑬]参见https://github.com/Stability-AI/stablediffusion/blob/main/LICENSE。
[⑭]参见https://huggingface.co/stabilityai/stable-diffusion-2/blob/main/LICENSE-MODEL