数据保护和利用的平衡之道——“数据知识产权”保护规则九问九答
作者:张丹 夏星悦 2024-05-10《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》把数据定位为第五大新型生产要素,数据已是数字经济时代的重要资源和媒介,在数字经济时代依法依规用好用活用足数据,是企业提升可持续创新能力、获取可持续竞争优势的基础保障,也是提升国家竞争力的重要手段。
随着技术的发展,数据的产生、收集、存储和利用变得前所未有的便捷,但同时也带来了一系列新的挑战与问题。如何在保障数据安全的同时促进数据流动,我们国家一直以来都在进行制度上的探索,而数据知识产权就是在数据安全和数据利用大背景下的尝试。
数据知识产权主要是对具有实用价值、智力成果属性的衍生数据给予保护,有助于激发企业创新活力,激励企业投入更多资源和精力开发新的数据技术并实现应用。本文将以问答的形式探讨数据知识产权的相关问题,分析其重要性、现状以及未来发展趋势。
一、什么是数据知识产权?
我们根据各地出台的数据知识产权相关试行规定,将“数据知识产权”概念汇总展示如下:
从上述概念中,可以提炼出“依法依规收集/获取”、“算法/规则”、“实用/应用价值”、“智力成果”四个关键词。
其中“依法依规收集/获取”指的是数据的来源应合法,数据来源包括公共数据授权、企业运营产生、个人授权取得、公共网站采集、交易市场购入、企业并购等渠道,数据的收集/获取应符合《网络安全法》、《数据安全法》、《个人信息保护法》等法律法规有关规定或者相关合同约定,不应侵犯国家安全、公共利益、商业秘密和个人隐私。“算法/规则”,指的是数据处理过程中算法模型构建等情况。涉及个人数据、公共数据的还应对数据进行必要的匿名化、去标识化等情况进行说明,确保不可通过可逆模型或算法还原出原始数据。此外,企业采用的算法/规则还应满足算法相关的合规要求。“实用/应用价值”,能成为知识产权的数据应该有具体的应用场景,能够解决实际的问题,且能带来一定的经济利益,无论是企业自身降本增效的利益还是对外交易获取对价的利益。“智力成果”,指的是对采集到的数据需要进行加工、分析、处理等智力劳动的投入,并不是广泛意义上、普遍意义上的数据,而是付出劳动和相关投入加工形成后的数据集合,未经规则化的不具有应用价值的数据集合不能称之为数据知识产权。
高富平教授在《数据知识产权保护论纲》一文中表示,由于数据本身并不是形态和价值稳定的资源,无法纳入产权登记体系,可通过建立共同规则实现数据使用权的交换和利用分享;而数据使用的结果导致创新,可以指导组织在商业竞争中作出智慧决策或智能行动,应当予以保护。知识产权制度定位于对创新智能成果的保护,因而数据知识产权保护的是有创造性劳动的数据使用阶段。“创造性劳动”对应的是“智力成果”,“数据使用”可以理解为“有应用场景”。
二、为什么要建立数据知识产权保护规则?
中共中央、国务院印发《知识产权强国建设纲要(2021—2035年)》、国务院印发《“十四五”国家知识产权保护和运用规划》,均提出研究构建数据知识产权保护规则。
国家知识产权局先后于2022年11月和2023年12月两次发布确定数据知识产权工作试点地方的通知[1],确定了两批共17个数据知识产权试点地方,并在第二批试点通知中提出了坚持“四个充分”原则的要求和“建立健全数据知识产权登记管理体系,提高登记质量,加强数据知识产权保护和运用”的试点目标。
国家知识产权局专利局副局长、战略规划司司长在第二十届上海知识产权国际论坛上表示,“数据具有鲜明的无形性特征,其又具有高流动性、易变化性的特点,并且大量数据的独创性也比较低。基于这些特点,一方面要适用知识产权理论,对符合一定条件的数据建立权益保护制度。另一方面,又不适宜建立像物权那样的独占权给予强保护,以免对数据合理流动造成限制。基于此,我们提出了建立一种赋权登记或者“登记赋权+行为规制”的模式和思路,既建立一种有限排他性权利,以行为规制的方式规制他人以不正当方式获取和使用数据,但是也不禁止他人依法依规获取并且加工形成的同样数据”。
从法条设定上来看,我国《民法典》第123条在对知识产权保护对象进行不完全列举的过程中,以客体形态对前述权利予以明示规定的同时,还专门设置了兜底条款,将“法律规定的其他客体”纳入知识产权法律体系之内,为数据等新型知识产权客体的引入留下了充足的法律适用空间。
而关于是否有必要创设独立的数据知识产权专门法,单晓光教授在其《数据知识产权中国方案的选择》一文中提出,创设独立的数据知识产权专门法律,目前并不是一种可实施的制度方案选择,而思考将数据融入现有知识产权客体之中,是当前应该选择的数据知识产权中国方案。
三、数据知识产权保护规则的法律框架?
原有知识产权相关法律法规等不在此赘述,仅就各地出台的数据知识产权试点新规进行总结汇总:
上述试行办法中均包括了登记主体、登记对象、登记内容、登记程序等章节。进行数据收集、存储、使用、加工、传输、提供、公开等行为的自然人、法人或者非法人组织均可成为登记主体[2];登记对象为依据法律法规规定或者合同约定收集,经过一定规则或算法处理的、具有商业价值及智力成果属性的处于未公开状态的数据集合[3];登记内容则包括了登记对象名称、所属行业、应用场景、数据来源、数据格式、数据规模、更新频率、算法规则、存证公证情况、样例数据等填写项[4]。
试行办法也明确了不予登记的情形,包括登记主体登记前未进行数据存证或者公证的,存在未解决的数据知识产权权属诉讼纠纷的,隐瞒事实或者弄虚作假等。此外,不同地方的试行办法对登记材料审核期、公示期以及登记证书有效期均有差异性的规定,如天津市的数据知识产权登记证书有效期为两年,而浙江省的数据知识产权登记证书有效期为三年。
四、数据知识产权与数据资产有何异同?
数据知识产权具备知识产权的基本特征:一是区别于传统所有权,知识产权是一种无形资产,不具有物质实体形态,是产生于精神领域的非物质化的财产权;二是知识产权具有可复制性,其所保护的客体可被复制和传播;三是知识产权主要保护智力创造成果,使得创造者能够从智力劳动中获得回报;四是知识产权只在法律规定期限内受到保护,超过法定期限该权利自行消灭。
数据资产是一个会计概念,作为无形资产的一种,具备无形资产的特征,即无形性和可复制性。但就智力创造成果而言,虽数据资产也强调创造性加工和劳动,但更关注该数据资产是否能为企业带来经济利益,换言之,如该数据达不到知识产权所应具备的“创造性”,但能够为企业降本增效,也可计入“无形资产”项下增设的“数据资源”会计科目或“存货”会计科目,继而成为企业的资产。就使用期限而言,数据资产也存在根据其使用寿命而在会计上确认的摊销年限,摊销年限结束,则数据资产归为零。
高富平教授在《数据知识产权保护论纲》中将数据使用者区分为五种类型,包括:A.初始数据采集者(形成未处理的数据);B.数据预处理者(产出可用数据集);C.数据汇集者(产出结构化或关联分析的数据资源);D.挖掘分析者(产出AI算法或智能工具);E.智能工具的使用者 (分析场景数据,产出知识或智慧行动)。其中,A、B和C是数据的生产者,而D和E则是知识的生产者。高教授认为,数据生产阶段并不需要配置新产权,可通过建立一致的规则和数据标准来实现数据的流通;而知识生产者产出的数据产品,形态相对稳定,价值固定且可评价,可以在专有权体系下考虑其保护体制。
如高教授所言,我们认为,数据知识产权多产生于知识生产阶段,而数据资产不限于知识生产阶段,数据生产阶段所产生的具有经济价值的数据产品亦可成为数据资产。
五、数据知识产权的保护路径?
目前数据知识产权通过数据知识产权登记的方式进行确权和保护。数据知识产权登记机构将申请登记主体的数据资源和数据产品的权属情况及其他事项进行记载和审核,审核并公示通过后,登记机构向登记主体发放数据知识产权登记证书,初步证明登记主体依法持有数据并可对数据行使权益,登记主体可通过质押、交易、许可等方式使用登记证书,如登记主体可通过数据知识产权质押的方式取得银行授信。
六、数据知识产权登记与数据产品登记有何异同?
数据产品是指有价值的数据在经过一定的加工、组合、开发后形成的可对外销售的产品或服务。可在大数据交易所进行确权登记,数据产品登记前,需要律所等合规评估服务商介入,对数据资源权属进行合规性审查并出具法律意见书,登记完成后,大数据交易所会向登记主体发放数据产品登记证书,该证书可作为数据交易、融资质押、数据资产入表、会计核算、争议仲裁的依据[5]。
数据知识产权登记和数据产品登记在一定程度上有相似性,登记证书都可以作为数据交易、融资质押、数据资产入表等的依据,但数据知识产权相较于数据产品,要求具备相当的智力创造性(满足知识产权客体的要求),而数据产品的范围则更大,不限于数据集合,也可能是数据服务或数据工具等。
数据知识产权的主管单位为各地知识产权局,而数据产品登记的平台为各地的大数据交易所,我们可以对比以下两种登记证书。
七、数据知识产权的登记流程?
下图为浙江省数据知识产权登记流程,其他省份的登记流程与之类似。
以北京数据知识产权登记为例,企业需要填写的登记信息包括数据集合名称、所属行业、应用场景、数据来源及证明、数据格式、数据规模、数据更新频率、算法规则、存证公证情况、样例数据以及数据知识产权登记承诺函等,登记机构会在3个工作日内对申请材料进行形式审核;经登记机构初步审查通过后,将在登记平台公示 10 个工作日,若公示期结束且无异议,登记机构颁发数据知识产权登记证书。
八、数据知识产权登记过程中的关注点?
我们总结,数据知识产权登记中有三点需要重点关注:一是数据来源,二是算法规则,三是存证公证情况。
数据来源合法是数据知识产权登记的前提,无法证明来源合法的数据将无法取得数据知识产权登记证书。数据来源包括自行运营产生、授权取得、公共网站爬取、交易购入、出资入股、并购取得等方式,无论何种方式取得,均应符合《数据安全法》、《个人信息保护法》等相关合规要求,如企业通过爬虫收集的数据需考虑如下合规要点:
(1) 是否通过自动化访问技术手段收集数据
(2) 收集对象是否为公开的网站或可访问的计算机信息系统
(3) 收集对象是否与自身经营业务存在实质性的竞争关系
(4) 是否存在利用破解网站加密规则、伪造身份认证信息、非法获取权限等技术手段突破或绕过网站设置的反爬技术
(5) 是否干扰被收集网站正常运行
(6) 是否事前评估被抓取网站日访问量并设置合理的访问频率
(7) 收集的数据是否涉及个人信息
(8) 收集的数据是否涉及商业秘密或受反不正当竞争法保护的数据
(9) 收集的数据是否涉及受著作权保护的作品
(10) 收集的数据是否限制用于商业用途
关于算法规则,主要是说明登记主体所申请的数据集合已进行必要的匿名化、去标识化,不会通过可逆模型或算法还原出原始数据,以确保不会侵犯国家安全、公共利益以及其他第三方的合法权益,其次是为了说明数据集合已实施了创造性劳动,属于知识产权调整的智力成果。
而关于存证公证情况,是数据知识产权的特别要求,登记主体在登记前,应当运用具有专业性和可信性的区块链等相关技术对申请登记的数据进行存证或进行保全公证,提升数据的可信赖、可追溯水平和价值可衡量性水平。如登记主体未进行存证公证,则无法取得数据知识产权登记,这也是数据知识产权登记与数据产品登记的重要区别之一。
九、数据知识产权登记的司法效力?
2023年12月14日,北京互联网法院公开开庭审理的北京数据堂公司与上海隐木公司著作权与不正当竞争纠纷一案,被告上海隐木公司就对已经取得《数据知识产权登记证》的北京数据堂公司的数据权属提出了抗辩,认为北京数据堂公司未能证明其收集的敏感个人信息取得了单独同意,因而诉请保护的数据财产权益并无法律依据。
由该案我们可以预见,在数据知识产权登记全面铺开之后,关于数据知识产权登记证书效力的司法案件必然会不断涌现,因此也有必要评价数据知识产权登记的司法效力问题。
国家知识产权局局长在本年度国务院新闻办公室举行的国务院政策例行吹风会上表示,数据知识产权登记证书可作为数据的权属证明,数据权利人拥有对所登记数据的持有、使用、交易和收益等权利,同时可规制他人以不正当方式获取和使用数据。
我们认为,数据知识产权登记的效力应与登记部门对登记申请进行审查的强弱程度相关,如登记部门开展实质性审查,则相当于登记部门对数据知识产权登记事项进行了背书,数据知识产权登记应具有较强的司法效力,而如果登记部门仅仅是形式审查,对登记的内容并不开展实质性认定,则数据知识产权登记的司法效力就较弱。同时,强弱是相对的,在不同的案件中应具体分析,但取得数据知识产权登记证书的登记主体是否必然对数据具有权属,我们认为不能划等号。
从目前各地的规定和实践来看,各地规章或规范性文件也均对数据知识产权登记申请的审查事项作出规定,目前只有山东省选择了实质审查方式,明确采取“登记平台初审、知识产权保护中心复审”模式,其他省份均采取了只对材料的完备性和完整性进行审查的形式审查模式。可见,数据知识产权登记的效力普遍较弱,在司法实践中难免被挑战,我们期待北京互联网法院对上述案件的裁判结果。
结尾
国家知识产权局局长在本年度国务院新闻办公室举行的国务院政策例行吹风会上表示,国家知识产权局开展的数据知识产权保护规则研究和试点工作已取得成效。在《推动知识产权高质量发展年度工作指引(2024)》中,国家知识产权局将推动“构建数据知识产权保护规则,研究制定数据知识产权政策文件,深化地方试点”列为了2024年度的重要工作内容。
尽管大家对数据是否可纳入知识产权保护对象,一直争论不休,但在数据驱动的时代,数据知识产权的重要性不言而喻,虽然目前这一领域仍面临诸多挑战,但随着技术的不断进步和人们对其认识的逐步深入,我们有理由相信,数据知识产权保护规则将得到进一步的切实发展。
参考文献:
高富平 || 数据知识产权保护论纲
https://mp.weixin.qq.com/s/llTfFI4bBlsJASktS5Ig5A
汤贞友:数据知识产权登记的制度逻辑及完善
https://mp.weixin.qq.com/s/l77AyKVXswab-AA2oQBM_g
论数据知识产权登记的司法效力 王会战 许雪芳
https://mp.weixin.qq.com/s/7XRzbr1CCC_HrqiHkzCmpw
葛树:数据知识产权保护规则的构建
https://mp.weixin.qq.com/s/_ckxgVSsj0UcGykfgWRI3w
单晓光|数据知识产权中国方案的选择
https://mp.weixin.qq.com/s/zaG41VBHx4y413fnHqEa7w
注释
[1] 《国家知识产权局办公室关于确定数据知识产权工作试点地方的通知》和《国家知识产权局办公室关于确定2024年数据知识产权试点地方的通知》
[2] 源自《北京市数据知识产权登记管理办法(试行)》第六条
[3] 源自《北京市数据知识产权登记管理办法(试行)》第二条
[4] 源自《北京市数据知识产权登记管理办法(试行)》第五条
[5] 源自《深圳市数据产权登记管理暂行办法》第七条