X

政府数据体内循坏的“孤岛现象”破冰,上海出台全国首部公共数据开放立法

数据共享与数据开放,是公共数据运用的车之两轮,鸟之双翼

《道德经》有言,“天下难事,必做于易;天下大事,必做于细”。公共数据的共享与开放,即属此类。

大数据,素有“二十一世纪的石油”之美称。而其中,大量的是公共数据,是指政府掌握的各类数据资源。政府内部如何共享数据,形成整体政府,如何向社会开放数据,促进经济社会发展,实在是一个宏大的命题。

如果政府不共享数据,轻则损及管理效能,重则酿成惊天惨剧。

2015年8月12日,天津港发生特大爆炸事故,百余名消防官兵瞬间牺牲,酿就了单个消防安全事故伤亡排名历史第二的惨剧(排名第一的是美国911恐怖袭击事件),教训极其惨痛:只要港口、交通、安监、消防等多个主体,能够有一方向出警的消防官兵披露,港口堆放是数十吨的硝酸铵、氢化钠等危险化学品,而不是普通的物品,消防官兵在赶到现场时,即可以选用泡沫灭火,而不能用水,从而避免催生剧烈化学反应的惨剧……正如国务院针对天津港“8·12”特大爆炸事故调查报告指出,“缺乏统一的危险化学品信息管理平台,部门之间没有做到互联互通,信息不能共享,是事故主要教训之一……”

殷鉴未远。斯时安监部门正修订《上海市危险化学品管理办法》,2016年8月,该部规章通过,明确规定,必须建立危险化学品监管信息交互平台。安监部门以及公安、交通、海事、质量技监、环保、工商等对行业、系统负有管理职责的部门,应当将日常监管中掌握的危险化学品生产、经营、储存、使用、运输和处置等环节的相关信息,实时录入本部门的监管信息系统。上海率先建立了危险化学品相关信息的共享制度。

此后,上海再度发力。市政府办公厅和市经信委推出《上海市公共数据和一网通办管理办法》,并于2018年11月1日起施行。该法明确规定,公共管理和服务机构之间共享公共数据,应当以共享为原则,不共享为例外,无偿共享公共数据。

2019年6月,国务院召开常务会议,明确要求推进“互联网+监管”,利用大数据等技术对违法行为早发现、早提醒、早处置,提高监管及时性、精准性、有效性。

数据共享与数据开放,是政府运用公共数据的车之两轮,鸟之双翼。

日前,《上海市公共数据开放管理办法》已经市政府常务会议通过,将于2019年10月1日起正式施行。

领养消防栓的启示——把皇冠上的明珠还给市场

什么是数据开放?2006 年英国《卫报》发表了题为 “把皇冠上的明珠还给我们”的文章,拉开了英国数据开放运动的序幕。作者把公共数据比作“皇冠上的明珠”,以凸显其中所孕育的价值。之所以称之为“还给我们”,因为这些数据是在政府开展行政管理和公共服务中形成的,是政府与企业、公众的管理服务互动中产生积累的。将这些数据开放出来,不仅有利于提高政府自身的治理能力和水平,更重要的是,将为数字经济的发展提供“原料”,释放出巨大的经济和社会效能。

随着大数据时代的来临,基于对数据的挖掘和分析,往往能产生出更为精确且出其不意的应用领域和应用场景,最终产生的价值,也往往会颠覆传统的认知!

以下兹举数例:

为什么不少买了紧身裤的人,不久后又买了新的手机屏幕?乍一看,这个问题没头没脑,但有互联网企业通过长期的数据积累研究发现,购买紧身裤的人,由于无法把手机放入贴身的口袋中,而经常导致手机掉在地上,造成手机碎屏。因而,大数据显示,近期买过紧身裤的人,有很大的概率会在未来购买新的手机屏幕。

还有一个流传很广的事例,一位美国男顾客投诉一家连锁超市,说该店竟然给他读高中的女儿邮寄婴儿和孕妇服装的优惠券,难道要鼓励未成年人怀孕吗?一周后,该名男子再次致电超市,向超市郑重道歉,因为他发现女儿真的怀孕了。原来,超市发现她的女儿购买了无香味的湿纸巾和补镁的复合维生素片。大数据显示,购买这两样东西的顾客孕妇的比例很高。由这些例子衍生出一个笑话,说一家公司董事会的高管们正在开会,一位高管的手机突然推送了一份防盗产品的广告,这位高管立刻起身告假,认为家里可能被盗了,要马上回去查看一下。

大数据时代,强调的关联关系,而不是因果关系。例如,中国某个县政府发现,近期到药店购买感冒药的人明显增多,并且持续数日之久,于是预判流感有可能爆发,接着采取了针对性预防措施……

以上数例,不难看出,数据在经济社会生活中发挥了重要的作用。但如果数据的挖掘与分析均由政府来完成,则囿于时间精力,以及显见的激励不足等原因,效果将大打折扣。相反,如果公共数据能够对外开放,借助于专业人士和市场力量,将挖掘出这些数据在行政管理、公共服务、市场推广、科学研究等方面的巨大价值。

例如,美国波士顿位于美国东北部,路边的消防栓在冬季经常被大雪覆盖,不易察觉。一旦发生火灾,容易延误救援。波士顿开放了市内13000个消防栓的位置数据。有社会组织开发了一款名为“领养消防栓”的应用软件,可以显示消防栓的位置信息,并监测消防栓的动态。市民可以申请“领养”一个或多个消防栓,并可以给消防栓命名。一旦消防栓被雪掩埋,它的主人将收到手机消息通知,并前去铲除消防栓周围积雪。

这一模式改变了过去单一由政府管理的低效率模式,通过数据开放,采用公益兼趣味的方式发动社会公众共同参与城市治理。又如,有数据利用者基于美国交通统计局、联邦航空局交通管制中心、美国气象局以及航班运行状况信息网站的数据,开发出航班晚点预报系统,能够比航空公司的正式通知提前告知用户,而且预测的结果和真实情况相差无几。这样的应用软件有助于乘客合理安排出行时间,保险公司也可以设计合适的保险产品,航空公司则可以合理调配运力,缓解旅客滞留情况,并改进航班准点率。

这一切的美好,政府所做的,只是开放了相关数据而已。

基于同样的理念,上海市经信委主办的数据开放创新应用大赛(SODA),也产生了许多优秀的应用案例。这个大赛之所以叫SODA,一方面是因为其英文简称恰好是SODA(Shanghai Open Data Apps),另一方面也寓意城市数据就像封装在瓶子里的苏打水,看上去悄无声息,却蕴藏着无穷能量。一旦数据开放出来,就像苏打水的开启,数据的价值会像气泡一样散发出来,产生更多的应用价值。随手举一个数据大赛的案例:一个数据利用团队利用交通部门开放的道路交通数据,开发了一个名为逆向闹钟的应用。其设计思路是通过对道路交通情况的预测,反推出合理的出行时间,再反推出合适的起床时间,自动设定闹钟提醒,建立一种全新的出行规划模式,实现为居民提供行程规划的服务系统。

他山之石——数据开放的国外立法及政策

天下万事,知易行难,数据开放,概莫能外。公共数据开放,由谁来开放?向谁开放?开放什么?错误数据的开放带来损失,由谁来承担责任?

唯立良法,方谋善治。

美国政府的数据开放政策,始于2009年奥巴马总统发布的主题为《透明和开放政府》备忘录的,要求“政府数据最大程度地向公众及创新公司开放”。这是奥巴马正式上任后,签署的第一份备忘录。同年制定的《开放政府指令》作为行政命令,向各级政府部门提出了具体的开放要求。英国政府在2011年至2012年相继发布了《关于秋季声明开放数据措施的更多细节》《开放数据白皮书:释放潜能》等关于开放数据的专门政策。2015年,通过政府立法的形式发布《2015公共部门信息再利用条例》,目的在于促进公共机构的数据能够更容易地被再利用,以发挥其政治、经济及社会效益。

在城市层面,纽约市通过地方立法、专门政策、行政指令等多种形式构建了较为完整的政府数据开放体系。2013年纽约制定了《数据开放法案》,规定了公共数据集的可获取性、开放平台管理、法律责任、技术规范、机构职责等内容。

有关国际组织在这方面也发布了不少报告、指南。经济合作与发展组织(OECD)指出,政府数据开放价值体现在三个方面,一是经济价值,会对经济产生推动力;二是社会价值,有助于改善公众生活;三是政治价值,提高了政府的参与度、透明度。总部位于英国的开放知识基金会下设的开放政府工作组(Open Government Working Group) 于2007年提出了政府数据获取和开放的八项原则:分别是完整性、原始性、及时性、可获取性、可机读、非歧视性(向所有主体一视同仁地开放)、非私有性(数据是可获得的,无任何实体有权排除他人使用)以及免于授权(数据不受版权、专利、商标或贸易保密规则的约束)。

通过前述梳理可以发现,许多国家和政府组织愈发认识到政府数据开放的价值,加快数据开放已然成为大势所趋。政府带头开放公共数据,并引导数据在数字经济、公共服务中的深入融合利用,一定会成为推动经济社会发展的重要源动力!

然而,国家没有上位法,各地方也没有一部完整的单行法。

上海的数据开放立法,来了

2018年10月,上海举行第三十次上海市市长国际企业家咨询会议。多位知名国际企业家在为上海城市出谋划策时,都不约而同地提出了数据开放的理念和具体的政策建议。ENGIE集团荣誉主席热拉尔·梅斯特雷在“更加符合国际惯例的营商环境”的主题发言中,基于“人人享有数据”这一条重要的国际实践经验,分享了自己的观点。他提出,上海可以建立一个向所有人开放的开放数据系统,使每个人都获得开放数据。特别是,通过一种特定的数据开放格式,政府信息能够被分析、重新组合,并且以一种新的方式进行展示,被各个组织开放性地加以利用。开放数据可以由市政府推动。通过建立起开放数据政策,加速开放数据,有助于企业界更快速的运用大数据,让上海进一步提高创新能力。

国际企业家们的建议与上海近年来开展的公共数据开放实践,可谓不谋而合。上海是国内最早开始公共数据开放探索实践的城市之一。早在2012年,上海市就建立了全国省级政府第一个公共数据开放平台,并在分级分类开放、数据安全管控、多元数据主体合作等方面开展了一系列工作。2017—2019年,根据复旦大学和国家信息中心数字中国研究院发布的中国地方政府数据开放报告,上海政府数据开放排名连续三年位居省级政府第一名。该评估报告从数据层、平台层、准备度、利用层四个维度进行考察,全面分析数据质量、数据数量、数据覆盖名称、数据获取方式、数据利用、成果产出、法规与政策、公众传播等近二十个指标的表现情况。作为国内最权威的数据开放第三方评估报告,这一评估结果反映出上海在公共数据开放积累了较为丰富的经验,有着较好的立法基础。

即使从全球的视角来看,上海的公共数据开放工作也可圈可点。上海社科院信息研究所2019年9月发布的全球重要城市开放数据指数,其选择了当今世界发展最具规模的且建有城市级开放平台的27个城市,上海的总体排名位居第五,位于首尔、纽约之后,但比洛杉矶、东京、巴黎、新加坡的评估表现都要好。

在制度建设层面,2018年9月,上海市以市政府令的形式出台了《上海市公共数据和一网通办管理办法》(市府9号令)。这是上海出台的第一部有关公共数据的立法,明确了公共数据集中统一管理的体制和机制,由市大数据中心对各单位的公共数据,按照应用需求进行集中统一管理,并编制全市公共数据资源目录;明确数据采集要求,各单位应当遵循合法、必要、适度原则,在目录范围内采集公共数据;加强质量管理,按照“谁采集、谁负责”“谁校核、谁负责”原则,由采集单位和市级责任部门承担数据质量责任。公共数据管理立法的颁布施行,使得公共数据的采集、治理、共享等数据管理行为有了基本的法律依据,为公共数据开放奠定了更为坚实的基础。

根据国际企业家们的建议,再结合上海自身的实践和立法基础,上海开始考虑出台一部专门规范政府数据开放的立法。立法任务明确后,市经信委、市政府办公厅、市司法局、市大数据中心组成联合立法起草组。首先就邀约了曾经在市长咨询会上提过建议的国际企业,进一步了解这些企业的建议和诉求。2018年12月26日下午,上海市司法局召开上海市公共数据开放管理办法立法座谈会,来自普华永道、达能集团、罗氏、诺华、美亚保险、汇丰银行、欧莱雅等公司的相关人员建言献策。

2019年1月16日,立法团队飞赴素有“数融万物,智创贵州”美誉的贵州省,学习相关经验。在贵州,我们了解到,小到精准扶贫的致贫原因分析、政府采购等公共资源分配过程中的异常行为监测,大到政府部门共享数据降低制度性交易成本、向市场开放政府数据助力经济发展社会进步,贵州都做了很好的尝试,也获得了党和国家最高领导人的肯定和赞许。举办的中国国际大数据产业博览会已连办四届,习近平总书记发来贺信、李克强总理到场致辞。大数据治理,已经蔚然成为贵州省的一张亮丽名片。同时,我们还在贵阳市充满现代气息的CBD办公楼调研了多家数据驱动企业,从企业的介绍中,我们感受到贵州省政府在推动数字产业发展做出的巨大努力。但万万没有想到的是,贵州省大数据发展局,居然栖身于上世纪60年代的一栋老旧居民楼内,湮没于市井民宅之间。同一栋楼,一半仍是居民住宅,另一半是政府办公,实在是太接地气了!我们开玩笑说,隔壁人家炒菜的香气都能飘到会场来。从事的是最前沿产业的推动、引导和服务工作,却格外低调至此,尽管可能是临时居所,也令人别有一番感慨!的确,贡献不能被外观所定义!为了公共利益,发自内心的真诚努力,最是动人心魄!

经过大半年的调研、起草、征询意见等环节,百般磨砺之下,2019年8月29日,应勇市长以市长令的形式签发了《上海公共数据开放暂行办法》,这是全国第一部专门规范公共数据开放的地方立法。

这部办法是在2018年《上海市公共数据和一网通办管理办法》基础上的深化和发展,可以理解为上海数据立法的第二季,将公共数据开放行为作为调整对象制定的专门性立法,内容涉及开放机制、平台建设、数据监管、数据利用、多元开放等多个方面,为数据开放行为构建了完整的制度链条。

另外,特别值得一提的是,此次立法除了在网上公开征求了社会公众意见之外,在市政府常务会议审议时,还首次邀请了5位业内专家走进了市政府,参加了常务会议的审议。这是市政府常务会议向社会公众开放审议方面作出的第一次探索。这不仅展现了政府开门听取意见的诚意,也反映出行政理念的深刻变化。

将一部规范数据开放的立法,作为探索政府重大行政决策开放的尝试,实在是再合适不过了吧!

【立法亮点】

公共数据开放,绝不等同于政府信息公开

公共数据开放和政府信息公开,到底是什么关系?这在立法起草过程中争论颇多的一个关键问题。公共数据开放是否要适用政府信息公开条例?公共数据和政府信息又是什么关系?要解释好这个问题,必须对“什么是数据、什么是信息”这一更为基础的问题予以界定。

数据和信息,这两个词包容性极强,在日常使用中,不同的语境下有不同的含义。横看成岭侧成峰,远近高低各不同。不同的学科,如法学、管理学、计算机学,对数据和信息的界定各不相同。要为这两个术语做出适用于所有场景的界定,显然并无可能。在这个时候,立法者的目的解释非常重要。

从建立数据开放制度的立法目的来理解,我们认为,所谓公共数据开放中的“数据”是指第一手的原始记录,未经加工与解读,而“信息”更多的是指经过连接、加工或解读之后被赋予了意义的产品。可以说,“数据”是原材料,是处于底层、体现出原始性的特点;而“信息”是利用数据加工后的产品,比如一份文件、一副图片等,人类可以直接识别的。通俗地说,数据是指大米,而信息则是指白米饭、八宝粥、炒米饭等各种加工后的产品。

鉴此,政府信息公开与公共数据开放,存在着以下差异:

一是价值不同。政府信息公开,其主要目的是保障公众的知情权和监督权,提高政府透明度,促进依法行政,侧重于其政治和行政价值;而公共数据开放则强调公众对政府数据的利用,重在发挥政府数据的经济与社会价值,促进数字经济发展,打造智慧城市。可以简单地说,信息公开是1.0版,满足的是民众的基本知情权问题,而公共数据开放是2.0版,解决的是更好更快地发展的问题。

二是客体不同。政府信息公开停留于“信息”层面,而数据开放则深入到了“数据”层面,强调开放数据具有原始性,而非简单的统计结论。数据开放强调的是数据集的开放,是由数据所组成的集合,通常以特定的文件格式出现,以适于机器读取。这样的理解与国家文件精神是一脉相承的。2017年5月,国务院办公厅印发的《政务信息系统整合共享实施方案》指出,要向社会开放“政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集”,其中就强调了数据集的概念。

三是对象不同。信息公开的对象是社会公众,对其身份、能力没有要求;数据开放更偏向有数据处理能力的用户,或者从事各种服务开发、学术研究的机构和个人。换言之,数据开放的对象,并不是普罗大众,这也是出于安全等方面的考虑。例如,如果公安的人口数据向所有的社会主体开放,即便进行过脱敏处理,仍有聪明人能够准确定位明星的住址,会给他人带来诸多困扰。

四是责任不同。政府信息公开的工作重点在于政府一方,公开信息后即已实现工作目标,而数据开放则需要政府和利用者双方同时着力,开放数据本身并未彻底完成这项工作,使数据被社会充分开发利用才是根本目的。另外,政府信息公开,适用的是政府信息公开条例,包括主动公开和依申请公开。如果是依申请公开,政府部门必须在20天内答复,并且可行政复议和行政诉讼。而数据开放,目前国家尚无立法,上海立法具有创制性,要解决的是政府不敢、不愿和不会开放的问题。

因而,公共数据开放不宜适用政府信息公开的相关规定,而应当在现行的政府信息公开规则之外,建立一套专门的、体现数据开放特点的制度。基于以上考虑,上海的立法将公共数据开放定义为:公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。

实际上,从政府信息公开条例的起草过程来看,其并没有考虑到公共数据开放这种形式。因为数据开放是大数据时代产生的新的需求。只有在互联网宽带普及和电子化数据大规模积累形成后,向社会公众开放政府数据才具备可行性。在互联网出现之前或者带宽很窄的阶段,政府部门电子化数据积累少,所谓政府信息公开就是指发布文本、统计数据等相对单一的行为。当然,将来随着公共数据开放工作的推进,不排除政府信息公开条例在修订时,进一步扩大适用范围,将公共数据囊括到政府信息的范围内,从而实行一体化的立法路径。

由谁来开放,开放什么——公共数据开放的主体和范围

2013年G8峰会上,美国、英国、法国、德国、意大利、加拿大、日本、俄罗斯八国签署了开放数据宪章。开放数据宪章作为政府间的协议,提出了五项开放原则(默认数据开放原则、数据质量和数量原则、人人可用原则、为改善治理发布数据原则、为激励创新发布数据原则),从而为世界其他国家、地区和有关国际组织开放数据提供了指引。

其中,默认数据开放原则是指政府应该开放除涉及国家安全、商业机密以及个人隐私之外的所有数据,对于不开放的数据必须说明不能开放的理由。

建立默认数据开放原则无疑价值非凡,然而,但凡越有价值的事物,实现的路途就越是崎岖坎坷。而且,原则往往确立的是方向,落实落地仍要务实而为,甚至要对目标的最终实现,保持足够的战略耐心。此时,精细的规则设计就显得格外重要。上海的立法基于操作性的考虑,重在明确数据开放责任主体和开放重点范围。

对于数据开放主体,本着分级开放、各负其责的理念,明确市人民政府各部门、区人民政府以及其他公共管理和服务机构(统称为数据开放主体)分别负责本系统、本行政区域和本单位公共数据的开放。这一规定明确了确定数据开放主体的基本原则,同时,为了避免责任不清、甚至相互推诿的问题,办法还明确在公共数据资源目录中列明数据开放主体。

在开放范围方面,考虑到数据开放工作毕竟仍处于起步阶段,无论从必要性还是准备度来看,都无法立即将公共数据全部对外开放。为此,办法确立了数据价值优先的原则,由主管部门根据本市经济社会发展需要,确定年度公共数据开放重点。与民生紧密相关、社会迫切需要、行业增值潜力显著和产业战略意义重大的公共数据,优先纳入公共数据开放重点。

例如,当下上海正在大力发展人工智能产业,并将广泛运用于城市运行和安全管理,这对交通、建设等部门的数据开放,有着切近的需求,这些部门就应当将相关公共数据的开放,列入工作的重点。

此外,借鉴国外立法所确立的政府数据开放的公众参与理念,办法既要求主管部门在确定公共数据开放重点时,应当听取社会公众的意见,也明确社会公众可以主动对数据需求提出意见建议,从而提高确立数据开放范围的科学性和民主性。基于开放范围和社会需求,主管部门制定公共数据开放清单,列明可以向社会开放的公共数据,并对外公布。开放清单应当标注数据领域、数据摘要、数据项和数据格式等信息,明确数据的开放类型、开放条件等。

需要强调的是,数据开放范围并不是一成不变的,而是动态更新的。数据开放主体应当建立开放清单动态调整机制,对尚未开放的公共数据进行定期评估,及时更新开放清单,不断扩大公共数据的开放范围。

在哪里开放——统一开放平台门户

从各国数据开放的实践来看,有一个共同的做法,就是建立统一的数据开放平台。通过平台汇聚所有列入开放范围的公共数据,并提供CSV、HTML、XML、RDF等格式的文件下载,或者提供API接口。有的平台还支持RSS技术以及数据信息的订阅,并提供相应的网站代码以供不同种类RSS阅读器的使用。

例如,美国2009年建立了联邦政府数据开放平台(www.data.gov),截至2019年8月底,已经汇聚并对外开放超过20万条的联邦政府数据集。英国(www.data.gov.uk)、澳大利亚(www.data.gov.au)、日本(www.data.go.jp)等国家也都建设了国家级的数据开放平台。不少城市还建立了市级层面的数据开放平台。如纽约市的数据开放平台(opendata.cityofnewyork.us),由纽约市长数据分析办公室(Mayor‘s Office of Data Analytics ,MODA)和信息技术和电信部(Department of Information Technology and Telecommunications ,DoITT)联合建立,纽约市100余个政府部门和公共机构均在该平台提供数据开放服务。

上海的办法也同样明确,建设全市统一的数据开放平台,所有的数据开放主体均应当通过开放平台开放公共数据,原则上不再新建独立的开放渠道。已经建成的开放渠道,应当进行整合、归并,纳入统一的开放平台中。

上海立法所确立的目标是,通过这个统一平台,汇聚所有政府部门及公共管理和服务机构的开放数据信息,并为数据利用主体提供数据查询、预览和获取等功能。

如何开放——数据分类分级

公共数据体量巨大、浩如烟海。不同的公共数据,其安全管理、信息保护、开发应用的要求,均存在较大的差异。例如,上海市所有星级饭店的基本概要数据,任何人都可以下载利用,属于安全管理要求较低的信息,也不存在特殊的数据监管要求。再如,上海公交车行驶路线和到站情况的实时数据,属于动态、持续性的数据,对使用人的安全管理和技术能力有较高的要求,对使用场景和后续使用监管也有严格的限制。

为此,办法确立了公共数据分类分级管理制度,要求主管部门结合公共数据安全、个人信息保护和应用要求等因素,制定本市公共数据分级分类规则。数据开放主体应当按照分级分类规则,结合行业、区域特点,制定相应的实施细则,并对公共数据进行分级分类,确定开放类型、开放条件和监管措施。

办法规定,对涉及商业秘密、个人隐私,或者法律法规规定不得开放的公共数据,列入非开放类;对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据,列入有条件开放类;其他公共数据列入无条件开放类。当然,非开放类数据依法进行脱密、脱敏处理,或者相关权利人同意开放的,仍然可以列入无条件开放类或者有条件开放类。

数据的分类,与数据的获取方式以及后续的监管措施息息相关。对列入无条件开放类的公共数据,任何自然人、法人和非法人组织可以通过开放平台以数据下载或者接口调用的方式直接获取,同时鼓励其进行数据的传播、使用。对于列入有条件开放类的公共数据,数据开放主体应当通过开放平台公布利用数据的技术能力和安全保障措施等条件,向符合条件数据利用主体开放。同时,要求数据开放主体与数据利用主体签订数据利用协议,明确数据利用的条件和具体要求,并按照协议约定通过数据下载、接口访问、数据沙箱等方式开放公共数据。

底线在哪里——安全保障和权益救济

确保数据的安全使用、保护数据主体的合法权益,是办法从起草之初就特别关注的问题。近期网上热议的ZAO软件收集人脸信息的问题,以及学校安装人脸识别仪器的事例,进一步凸显了社会公众对数据安全的关注。为此,办法总则开宗明义,明确市、区人民政府及各相关部门在公共数据开放过程中,应当落实数据安全管理要求,采取措施保护商业秘密和个人隐私,防止公共数据被非法获取或者不当利用。

宣示性的话语远远不够,其落实落地,还需要细密的规则。

为此,办法规定,在数据使用监管方面,数据利用主体应当按照开放平台管理制度的要求和数据利用协议的约定,在利用公共数据的过程中,采取必要的安全保障措施,并接受有关部门的监督检查。数据开放主体应当建立有效的监管制度,对有条件开放类公共数据的利用情况进行跟踪,判断数据利用行为是否合法正当。对于数据利用主体的违法行为,如采用非法手段获取开放平台公共数据、超出数据利用协议限制的应用场景使用公共数据等,主管部门有权采取限制或者关闭其数据获取权限等措施,并可以在开放平台对违法违规行为和处理措施予以公示。

在公众权益保护方面,虽然办法通过一系列制度来提高平台开放数据的质量,但仍然无法百分之百避免数据存在错误、遗漏等问题。为此,办法建立了异议处理制度。对于数据错误、遗漏的,社会公众可以通过开放平台向数据开放主体提出异议。数据开放主体经大致确认后,应当立即进行异议标注,并由主管部门在各自职责范围内,及时处理并反馈。对于社会公众认为开放数据侵犯其商业秘密、个人隐私等合法权益的,可以通过开放平台告知数据开放主体采取中止开放的措施,并提交相关证据材料。在处理方面,借鉴互联网法律领域的“红旗原则”,数据开放主体收到相关材料后,认为必要的,应当立即中止开放。同时,对相关证据进行核实,再根据核实结果,分别采取撤回数据、恢复开放或者处理后再开放等措施,并及时反馈。

我们期待,这样的处理方式,可以在第一时间最大限度地保护社会公众的合法权益。

一个备受争议的问题——能否收费

公共数据开放是否可以收费?在立法过程中,这一问题争议极大。

有观点认为,根据《政府信息公开条例》第42条的规定,行政机关依申请提供政府信息,不收取费用。但是,申请人申请公开政府信息的数量、频次明显超过合理范围的,行政机关可以收取信息处理费。后面一款的规定,主要是为了防止滥用信息公开的权利。类推可知,公共数据开放,也不得收取费用。

另有观点则认为,如前所述,数据开放与信息公开存在很大的差异。数据开放强调数据的原始性,而原始数据开放的成本要高得多,需要对数据进行治理、更新,对系统进行维护、对使用进行监管,有的数据开放还要提供实时的、不间断的传输服务。显然,这些额外的成本比政府信息公开要高得多。

其实,此种争议在国外也普遍存在。就是否可以收费,国外的政策也没有达成一致。纽约在《开放数据政策与技术标准手册》(Open Data Policy and Technical Standards Manual)中明确了开放授权原则,除一些特别规定外,数据应当无条件地对外开放,并承诺开放数据是透明、可获取且免费的。欧盟的做法有些差异,为了弥补数据收集和维护运营的费用支出,其《政府信息资源再利用指令》规定,数据利用是可以收费的,但实行成本回收原则,即收费不得超过生产和传播数据的成本。

笔者认为,正因为数据开放与信息公开存在较大差异,在某些情况收取适当的费用可能是合理的。数据开放更多的带有一种服务性质,特别是数据的采集、加工、治理均有成本。在数据开放中,有些数据利用主体会提出个性化的需求,或者数据使用量特别巨大、使用时间持续较长,而且往往这些数据利用行为是出于商业目的的考虑。对此,显然不应当通过财政支出来满足商业企业数据利用的个性化需求。财政支出,就是纳税人买单。全体纳税人不应当为个别主体的个性化需求来买单。

另外,在我们调研过程中,企业谈到收费问题是,大多数都表示愿意通过适度付费的方式来获取公共数据。目前难度在于,根据现行的财政管理制度,行政机关即使收取费用,也是实行收支两条线管理,并无法将该费用直接用于数据开放。为此,办法中对该问题没有做出规定,采取了立法留白处理,为将来政策进一步确定留出空间。我们认为,将来比较理想的方式是成立法定机构,专门负责个性化的数据利用需求,并可以按照透明、微利的原则收取适度的费用,所收费用只能用于改善数据开放的质量。

最后,我们必须说,公共数据开放非常重要,代表了未来的一种发展趋势,但我们不希望它成为一种放之四海而皆准的万能工具——因为越是万能的,就越是空洞的。人类学家克利福德·吉尔兹(Clifford Geertz)在其著作《文化的解释》中曾给出了一个朴素而冷静的劝说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”

此话用于公共数据开放,同样深刻。

2019年8月举行的上海国际开放数据论坛暨开放数据创新应用大赛(SODA)启动仪式上,立法起草组成员悉数到场。全场嘉宾在主持人的号令下同时开启苏打水,小小的仪式,寓意着共同推动公共数据开放的美好愿景。我们希望上海数据开放办法的颁布施行,将为数据的开放提供强有力的制度支撑。

立良法,谋善治。从数据共享到数据开放,上海的数据立法,已经从第一季走向了第二季,但这绝非终点。用好大数据资源,助推营商环境优化,永远在路上。道阻且长,行则将至。我们深信,在不远的将来,上海数据立法还会继续推进第三季、第四季……

(作者:罗培新,上海市司法局副局长,法学教授;常江,上海市司法局立法二处处长,法学博士。感谢裘薇、崔艳春、黄雄、王晓妹、刘迎风、杜何阳、薛威等立法团队成员以及复旦大学郑磊教授等专家成员。)

栏目主编:王海燕 文字编辑:王海燕 题图来源:视觉中国 图片编辑:徐佳敏