公共数据授权运营的法律边界与合规之道
作者:张丹 孙建玲 2024-08-20公共数据的授权运营被视为推动公共数据资源开发与应用的关键策略。2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“《数据二十条》”)明确提出要建立公共数据确权授权机制。目前全国各地也在紧锣密鼓的制定公共数据授权运营相关政策、建立地方数据管理机构、构建公共数据开发平台、积极探索公共数据应用创新,初步掀起了公共数据授权运营的热潮。
公共数据授权运营在全国各地迅速开展同时,数据产品挂牌交易也在各地数据交易所开展的如火如荼。在为国企客户提供数据产品挂牌法律服务时,我们常会面临的问题是国企拟挂牌的数据集或数据产品是否属于公共数据的范畴?在数据授权开发环节是否需要遵守公共数据授权运营的相关规定?公共数据的授权运营是否可能违法?公共数据产品登记权人是否具有相应权属?
虽然公共数据授权运营政策频出,但对于公共数据到底指哪些数据以及公共数据如何合规运营业内仍在持续讨论。本文第一部分旨在着重从国家政策、地方政策以及学术讨论三个层面出发,对公共数据的界定模式以及现状进行梳理。通过对不同层面政策文件中关于公共数据定义的研究,分析其中的共性与差异,从而揭示公共数据界定的核心要素和潜在趋势。同时,参考学术界对于公共数据范畴的理论探讨,进一步丰富和完善对公共数据的理解。本文第二部分旨在着重分析在促进数据开发利用、激活数据要素的过程中,公共数据如何授权运营以及授权运营的合规要点,以期形成完整的公共数据授权运营合规边界。
(一)公共数据的法律界定
1. 国家政策层面对公共数据的界定
我国公共数据开发利用经历了三个阶段,分别是共享、开放、授权运营。近二十年来,从“政府信息公开”到“政府数据开放”,我国政务数据开放、共享相关制度建设取得了长足进步。[1]公共数据最初指政府数据、政务数据,其内涵呈现出公共机构主体和行政职权行为“双要素”属性。[2]
2020年4月,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》明确将数据作为与土地、劳动力、资本、技术等并列的生产要素。2021年3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“《十四五规划》”)首次提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”。随着数据在国家发展战略层面被确认为生产要素,开展数据授权运营试点等政策的颁布,有关国家政策中存在“政府数据” 、“政府部门数据” 、“公共数据” 、“公共机构数据” 、“公共信息数据”等多种概念。
我们梳理了国家层面关于公共数据开放、开发利用、授权运营的重要政策中关于公共数据的表述(如下表),以初步窥探国家层面政策中对公共数据的界定。
通过梳理,我们能够清晰地发现,在以促进数据开发利用、激活数据要素的价值为导向的国家层面政策文件体系当中,同时运用“政府数据”和“公共数据”这两个概念的情况是较为常见的。然而,此类政策文件既没有清晰明确地界定政府数据、公共数据的内涵,也没有对政府数据和公共数据进行有效的区分,这就可能导致在实际执行过程中出现理解和操作上的偏差。
直到 2022 年出台的《数据二十条》,才第一次给出了公共数据的概念。但遗憾的是,这次给出的概念也并未进行详细的阐释和细化,仅仅是进行了简单的归纳,指出各级党政机关、企事业单位在依法履行自身职责或者提供公共服务的过程中所产生的数据,属于公共数据的范畴。《数据二十条》虽然给出了公共数据的初步定义,但由于不够详尽,在具体的应用场景中,可能还需要进一步的解释和补充,以增强其可操作性和指导性。
2. 地方政府视角中的公共数据范围
虽然国家层面对于公共数据尚无统一明确细化的界定,但在顶层政策支持的背景下,自2020年至今全国各省、市纷纷制定公共数据授权运营政策,积极探索公共数据授权运营模式,开展公共数据有序合规授权运营。
我们梳理了北京、上海、浙江、深圳等多地公共数据授权运营政策法规中对公共数据的定义(如下表),以期能够从各地方政策的视角来识别和理解公共数据的范畴。
在各地的公共数据相关政策中,对于公共数据的定义总体呈现出趋同性,主要通过“主体要件+行为要件”的模式加以界定:其一,在收集和产生数据的主体方面,着重强调为国家机关、经授权具备管理公共事务职能的组织,或者是提供公共服务的组织;其二,在行为层面,突出数据是在依法履行职责或者提供公共服务的过程中被收集和产生的。
主体要件方面,虽然大多数省市将国家机关和法律法规授权的组织纳入公共数据的主体范围,但对事业单位和提供基础公共服务的组织是否包含在内,各地区的规定有所不同。具体差异如下:
北京:规定公共数据的主体要件主要包括国家机关和依法获得授权、具有管理公共事务职能的组织。
上海与浙江:通过具体列举的方式,明确将供水、供电、供气、公共交通等提供基础公共服务的组织纳入公共数据的主体范围。
四川与深圳:对提供公共服务的组织的界定最为广泛,不仅包括供水、供电、供气、公共交通等组织,还扩展到了医疗、教育、通信、文化旅游、体育、环境保护、卫生健康、社会福利等领域的其他公共服务组织。
山东与江苏:没有采用列举的方式,而是采用了更为概括性的表述,将具有公共服务职能的企事业单位统一纳入公共数据的主体范围,没有具体限定服务的类型。
这些差异反映了各地区在界定公共数据主体时的不同侧重点和考虑因素。一些地区倾向于具体明确地列举包含的公共服务企业类型,而另一些地区则采用更广泛的概括性描述,以适应不断变化和发展的公共服务需求。这种多样性有助于各地区根据自身的实际情况和需求,灵活地管理和利用公共数据资源。
3.学术界对公共数据的边界的讨论
随着《数据二十条》的出台以及全国多地相继出台针对公共数据开发利用的政策法规,学术界围绕公共数据的讨论热度也持续升高。当前学术领域中有关公共数据的研究主要涵盖以下几个方面,重点围绕如何更好地开发利用公共数据资源展开:其一,聚焦于公共数据自身的研究,涵盖公共数据的概念、权属、性质等内容。其二,针对公共数据开放利用的问题、路径以及机制展开研究。其三,对地方公共数据治理和立法进行比较或实证方面的研究。[3]
除前面所述国家及地方政策中采用的“主体要件+行为要件”界定模式外(即公共机构产生模式),学术界对于公共数据界定几种常见的模式有公共财政资金支持模式、公共用途模式、公共利益相关性模式、综合模式。
(1) 公共财政资金支持模式
公共财政资金支持模式强调数据的产生或收集是由公共资金资助的。比如,由政府科研经费支持的科研项目所产生的数据。
在该种模式之中,不管是从主体的角度出发,还是依据相关的行为要件来考量,资金来源是否全部或者部分源自公共财政,这一点都属于十分重要的判断标准。[4]例如,当我们判断某个项目或活动所产生的数据是否属于公共数据时,首先需要审视的就是其资金的来源情况。如果资金全部或者有一部分是由公共财政提供的,那么这就为将其产生的数据认定为公共数据提供了重要的依据和线索。又如,对于某些企业的运营数据,如果其在发展过程中接受了公共财政的支持,那么在判断这些数据的性质时,资金来源这一因素就具有关键的影响力,可能会促使其被归类为公共数据。
(2) 公共用途模式
公共用途模式下,只要数据用于公共目的,如制定公共政策、提供公共服务等,就被定义为公共数据。例如,企业为政府提供的用于规划城市建设的地理信息数据。有专家持有此种观点,认为公共数据不一定是公共部门生产或持有的数据,而应是公众必须要用又无法自给的数据,即公共品数据。具体来说,不能简单依据数据生产者的公共属性来界定公共数据,私人部门生产的数据也可能是公共品,随着社会发展和数字化转型,一些原本不属于公共品的数据,如酒店报价数据、点评数据等,可能会变成公众所必需的数据而成为公共品。[5]
(3) 公共利益相关性模式
公共利益相关性模式通常强调数据与公共利益之间的紧密联系。在这种模式下,公共数据被定义为那些对公共利益具有直接或间接影响、与公共事务密切相关的数据。这些数据的获取、使用、管理和共享会对社会整体或特定群体的公共利益产生显著作用。
如有专家提出,公共数据不但涵盖公共机构数据和公共服务企业数据,还包含社会数据中与公共利益具有相关性的部分,并且认为公共数据的核心特质在于数据的“公共性”或者“公共利益相关性”。[6]还有专家尝试把在公共领域或空间中产生的、涉及公共利益的数据也归入公共数据的范畴。例如,有观点认为平台数据既能够被视作个人所有、平台所有,也能被视为个人与平台共有,还可以被认定为是互联网空间的公共数据。[7]
(4) 综合模式
在该模式下,在定义公共数据时,会综合考量公共机构、公共资金、公共用途、公共利益等多个方面的因素。例如,中国软件评测中心《公共数据运营模式研究报告》在对公共数据定义时既考虑了公共数据来源主体、又考虑了公共财政资金的支持以及公共利益,将公共数据分成以下五种类型:
① 政务数据,即政务部门依法履职过程中采集、获取的数据;
② 具有公共职能的企事业单位在提供公共服务和公共管理过程中产生、收集、掌握的各类数据资源,如教育数据、医疗数据、交通数据、社保数据、水电煤气数据等;
③ 由政府资金资助的专业组织在公共利益领域内收集、获取的具有公共价值的数据,如基础科学研究数据;
④ 具有公共管理和服务性质的社会团体掌握的与重大公共利益相关的数据;
⑤ 涉及公共服务领域的其他数据,如社会组织和个人利用公共资源或权力,在提供公共服务过程中收集、产生的涉及公共利益的数据。[8]
4. 公共数据的界定建议
鉴于在国家层面的政策当中,尚未对公共数据给出清晰明确的定义,而学术界针对公共数据的范围同样存在诸多争论,并且呈现出逐渐扩大的态势。在公共数据授权运营以及后续的公共数据产品挂牌项目中,对于公共数据的认定,我们建议,最适宜的做法是参照各地方政府关于公共数据授权运营的政策,采用“主体资格+行为条件”的双重标准来界定公共数据。具体来说:
(1) 在数据收集和产生的主体资格上,应重点考虑国家机关、事业单位、依法获得授权负责公共事务管理职能的机构,以及提供各类公共服务的机构。
(2) 在行为条件上,应明确数据是在依法履行公共事务管理职责或提供公共服务过程中收集和生成的。
这种界定方式有助于确保公共数据的认定既符合法律法规的要求,又能适应不同地方政府的具体实践和管理需要。
(二)公共数据授权运营的合规边界
1. 公共数据授权运营的定义
从上表可看出,“公共数据授权运营”概念中有几个关键词,分别是“授权人”、“被授权人”、“授权的公共数据”、“数据产品或服务”。“授权人”是大数据主管部门或数据提供单位,我们可以理解为公共数据的合法持有人;“被授权人”是符合条件的法人或非法人组织,自然人一般不能成为被授权人,且个别地方的“被授权人”仅包含法人,不包含非法人组织;“授权公共数据”是指被授权人可开发利用的部分公共数据,如特定行业/领域的公共数据;“数据产品或服务”是指利用公共数据加工形成的产品和服务,主要有数据集、数据接口等数据类产品,特定算法加工处理形成的数据模型类产品,数据报告、解决方案等定制类产品,以及其他形态的数据产品和服务。
2. 公共数据运营的历程
公共数据运营经历了三个渐进式阶段,包括内部利用阶段、开放阶段和开发利用(商用)阶段,具体为:
公共数据内部利用阶段:从1993年启动的“三金工程”到2002年规划的“两网一站四库十二金”,我国各类政务网站、信息系统、数据资源库经过多年建设,积累了海量公共数据。政务部门基于自身业务与决策需要,梳理、整合业务数据并加以开发利用,在电子化的基础上实现了内部流程优化、公共服务便捷化。例如,教育部专门成立数据资源服务处,并建立中国高等教育学生信息网(学信网),由相关公司负责运营,开展学籍学历数据采集、使用、发布审核工作,提供学籍学历的查询服务。
公共数据开放阶段:随着信息公开、政府网站建设、在线政务服务的推进,政务部门与平台、网站运营企业之间建立起较为稳定的信任机制,“管运分离”的数字化建设发展模式逐渐成熟。在公共数据治理成效较好的行业领域和地方,面对企业和社会的普遍需求,政务部门在满足自身基本利用需要外,开始探索公共数据的社会化利用,以数据开放的方式对外提供数据集或较为基础的数据服务。例如,交通运输部基于信息化技术研究项目,建成综合交通出行服务数据开放、管理与应用的“云出行”平台,为社会公众提供综合交通出行信息服务。
公共数据开发利用阶段:不再仅仅局限于简单的公共数据开放与共享,而是借助繁杂的数据分析及挖掘技术,对公共数据的价值进行深度开掘,进而提炼出更具商业价值的信息和深刻洞察。在此阶段,涌现出众多基于数据的商业模式,像数据交易平台、数据服务供应商、数据驱动的解决方案提供商等,致力于将数据转变为能够量化和评估的资产,并积极探寻数据资产的定价机制以及交易模式。在该阶段,政府部门进一步探索将公共数据授权给有能力对数据进行开发利用的法人或非法人组织,以实现公共数据的价值最大化。
3. 公共数据特许经营模式
在公共数据开发利用早期,地方政府曾采用特许经营模式将公共数据授权给第三方。引发业内广泛关注的案例是2023年11月衡阳市发布的政务数据资源和智慧城市特许经营权出让项目,衡阳市人民政府宣布出让该市政务数据资源和智慧城市特许经营权,第三方在拿到授权后向使用者进行收费,该数据资产的挂牌底价为18.02亿元,增价幅度为1000万元。然而,距离公告发布仅仅几天,该“政务数据第一拍”就被紧急叫停,原因不详。
我们猜想叫停原因可能有三,一是公共数据特许经营的合法性,《基础设施和公用事业特许经营管理办法》等相关特许经营规定中并没有关于公共数据的特许经营,缺乏法律文件的支撑;二是公共数据定价的合理性,缘何评估为18亿,评估依据不确定,如果该项目成功,全国有600多个市,将撬动万亿规模的公共数据授权市场;三是公共数据授权模式尚缺乏上层文件,各地还处在公共数据授权模式的摸索中。
4. 公共数据授权运营模式
虽然衡阳公共数据特许经营授权模式暂停,但是公共数据授权却不会止步于此,各地开始陆续出台公共数据授权运营管理办法。除了下述省级政府部门发布的公共数据授权运营管理规定外,还有宁波、南京、扬州、枣庄、无锡、济南、金华、青岛、长春等市级政府部门发布了公共数据授权运营管理规定。
上述已发布或尚未发布的管理规定中,公共数据授权运营模式有所不同,如江苏采取“两级主体、分级授权”模式,两级主体指运营主体和开发主体,分级授权指设区的市级以上人民政府授权本级数据主管部门试点确定本级运营主体,运营主体再选择开发主体进行数据开发利用;贵州省采取分级授权模式,授权运营主体由各级人民政府数据主管部门统一授权,开发利用主体由各级政府部门授权;南京市采取公共数据专区授权模式,划分为综合领域专区和行业领域专区,分类推进授权运营工作;济南市采取综合授权、分领域授权的方式,并探索分级授权。
以扬州市为例,扬州市公共数据授权运营采取“两级主体、分级授权”模式,市政府授权数据主管部门确定一级运营主体,授权运营期限一般不超过2年。一级运营主体选择二级开发主体进行数据开发利用,并签订授权协议。一级运营主体的主要职责为运营平台建设、开发利用管理、服务能力支撑、市场生态培育和安全保障。二级开发主体基于应用场景需求,在一级运营主体搭建的授权运营平台上,开发利用经授权的公共数据,形成数据产品,并向社会提供服务。
5. 公共数据授权运营的合规要点
(1) 被授权主体是否满足准入要求
一般来说,公共数据授权运营管理规定对被授权主体都有准入要求,以江苏省为例,开发主体必须符合以下基本条件:
① 遵守国家和本省对公共数据授权运营的有关规定。
② 经营状况良好,单位及其法定代表人无重大违法记录,未被列入失信被执行人名单、重大税收违法案件当事人名单、信用中国“严重失信主体名单”。
③ 具备开展公共数据开发利用工作的专业团队和服务能力。
④ 落实数据安全负责人和管理部门,建立数据管理安全保障制度;近3年未因发生网络安全或数据安全事件被公开通报。
如果被授权主体未落实数据安全负责人和管理部门,也未建立数据管理安全保障制度,那么就不符合被授权主体的条件。
(2) 授权程序是否合法合规
各地的公共数据授权运营程序有所不同,比如江苏,运营主体按照准入条件和应用场景选择开发主体进行数据开发利用,并签订授权协议;但在河北,跨领域、跨区域的公共数据须由数据主管部门组织对应用场景、数据安全及运营单位等进行评估,经本级公共数据授权运营协调小组审议同意后,与运营单位签订协议,方可开展公共数据运营(此处“运营”指数据产品的研发和运营);单一领域的公共数据须由行业主管部门会同数据主管部门组织进行评估,经本级公共数据授权运营协调小组审议同意后,与运营单位签订协议,方可开展公共数据运营,未经公共数据授权运营协调小组同意,任何单位不得与第三方签订公共数据运营协议。因此,授权程序应满足当地的合规要求。
(3) 授权文件是否合法合规
在实践中,我们遇到部分公共数据产品挂牌登记项目中,公共数据授权文件仅有一页纸,授权内容过于简单,这就不太符合公共数据授权运营相关规定中的要求,以江苏省为例,授权主体与被授权主体之间应签署《授权协议》,且授权协议应明确各方权利义务、授权范围、服务期限、服务费用、安全要求、禁止条款、信用承诺、退出机制和违约责任等;且协议有效期限不得超过授权期限,在授权期限届满3个月内,应按程序重新申请。
(4) 被授权主体的行为规范是否合法合规
各地均对被授权运营主体提出了行为规范要求,以浙江省为例,被授权主体要在授权运营域内对授权运营的公共数据进行加工处理,形成数据产品和服务,原始数据包不得导出授权运营域;被授权主体所有参与数据加工处理的人员须经实名认证,签订保密协议,操作行为应做到有记录、可审查;被授权主体应使用经抽样、脱敏后的公共数据进行数据产品和服务的模型训练与验证;经公共数据主管部门审核批准后,被授权主体方可将依法合规获取的社会数据导入授权运营域,与授权运营的公共数据进行融合计算;数据产品和服务不得用于或变相用于未经审批的应用场景等。
6. 总结
希望本文对公共数据范畴的探讨能助力大家更准确地判断其数据的属性。对于被视为公共数据的数据运营和使用,不仅要遵循《数据安全法》、《个人信息保护法》、《网络安全法》等一般性的数据保护相关法律规定,而且还应当遵守本文第二部分提及的公共数据授权运营方面更严格的合规要点,按照公共数据授权运营政策规定的程序进行授权及运营。
公共数据的授权运营仍处于不断发展和完善的阶段。尽管当前在实践中还存在诸多问题和争议,但随着政策的逐步明晰、实践经验的不断积累以及学术研究的深入推进,我们有理由相信,未来公共数据的授权运营将更加规范、高效,为经济社会的发展注入强大的动力。在这一进程中,建议大家密切关注政策动态,共同推动公共数据资源的合理开发和有效利用,让公共数据真正成为促进创新、提升治理能力和服务水平的重要支撑,发挥其作为生产要素的价值。
注释
[1] 王锡锌、王融:《公共数据概念的扩张及其检讨》。
[2] 王锡锌、王融:《公共数据概念的扩张及其检讨》。
[3] 伏羲智库和清华大学互联网治理研究中心:《公共数据界定问题研究报告》。
[4] 伏羲智库和清华大学互联网治理研究中心:《公共数据界定问题研究报告》。
[5] 朱扬勇:《依照数据用途界定公共数据》。
[6] 刘平、史莉莉、张延新、王松林:《公共数据开放相关法律问题研究》。
[7] 丁晓东:《数据到底属于谁?——从网络爬虫看平台数据权属与数据保护》。
[8] 中国软件评测中心:《公共数据运营模式研究报告》。