܄ 

解析:中国公共数据资源开放利用的羁绊

【数据猿导读】 数据是人类从事科学研究、技术设计、实验检验、统计分析等活动,而形成的定量、定性化符号、记录或其他原始资料,包括数字、文字、图形、图像以及其他形式。当前,数据开放利用已成世界各国网络空间国家战略的共同政策实践。

解析:中国公共数据资源开放利用的羁绊

信息社会发展到下一个技术周期,将以云计算、大数据、多语种智能搜索和深度学习等信息技术为代表,进入数据竞争时代,数据优势成为核心竞争力和综合软实力,决定着企业和国家在信息经济中的地位和可持续发展能力。立足于提高国家创新能力,美国实行长期的数据开发利用战略;反思我国,数据获取能力较低,数据开发利用政策实践有待进一步增强持续性和系统性,数据竞争整体劣势较为明显,因此,宜采取果断行动,研究实施可全面提升数据竞争能力的数据开发利用国家战略。

数据是人类从事科学研究、技术设计、实验检验、统计分析等活动,而形成的定量、定性化符号、记录或其他原始资料,包括数字、文字、图形、图像以及其他形式。当前,数据开放利用已成世界各国网络空间国家战略的共同政策实践。

(一)数据开放利用的战略意义

数据开放利用对于培育创新经济、建设创新型国家以及发展大数据战略性新兴产业具有重要的战略意义。一是数据开放利用是提高社会生产力的重要前提。数据开放利用程度越高,信息和知识作为生产要素的价值越高,对于解放和提高社会生产力的作用和贡献也就越大。二是数据开放利用是推动经济社会全面发展的重要途径。数据开放利用可以促进信息交流和知识共享,提高经济增长质量,推动经济社会发展转型,有效增强国家综合国力和国际竞争力。三是数据开放利用是建立数据驱动型增长新模式的重要前提。数据开放利用可以将数据作为资产直接变现,实现数据增值和收益,继而形成重要的竞争优势,直接推动国民经济实现创新型、可持续的增长和发展。

(二)我国数据开放利用存在的问题

早在2004年12月,我国就发布施行了《关于加强信息资源开发利用工作的若干意见》,开始启动我国信息资源开放利用的政策行动;2006年5月中办、国办发布的《2006—2020年信息化发展战略》再次要求“加强信息资源的开发利用”;2007年4月我国又制定施行了《政府信息公开条例》。但是由于种种原因,我国信息资源开放利用战略的总体进程不尽理想。一是原初的规划设计没有划分信息资源的类型。已有政策规划过多地考虑了政府信息资源的开放利用,商业数据、行业数据、企业数据、技术数据、个人数据等其他形态数据的开放利用未被统一纳入议事日程。二是原初的规划设计难以适应新兴技术条件下的数据开发利用需求。已有政策规划以本世纪前10年信息通信技术水平为背景,缺乏后续政策跟进和累进式推动工作,已经难以指导现今云计算、大数据背景下的数据开发利用实践。三是我国数据开放利用整体水平较低,原初规划设计的目标尚未实现。根本原因在于,不同地区、部门之间数据开放利用的水平不同;不同地方之间的数据口径不一致,统计数据差别巨大,数据质量和可信度较低等。凡此种种,均要求我国应当重新考虑推动信息资源开放利用国家战略相关政策行动。

(三)我国数据开放面临的重大挑战

自从《关于加强信息资源开发利用工作的若干意见》发布施行以来,我国政府信息资源开放行动已经启动,各个层面的信息资源开发利用合作化运动开始萌芽,但是信息资源开放利用总体水平不高,主要表现在,一是缺乏政策和规则向导,数据开发利用无序进行。由于没有明确的规则,企业之间互相获取对方数据成为难以克服的重大难题,数据在不同企业之间进行跨平台应用和流通基本无章可循且处于普遍停滞状态,数据价值和数据红利对经济难以产生溢出效应。二是数据私有化趋势日益明显,数据开发利用面临严峻挑战。绝大多数人工整理的数据处于“暗网世界”,尚未实现开放利用;互联网数据封闭趋势明显,淘宝、优酷以及众多垂直网站针对搜索引擎进行封闭和屏蔽,诸如位置感知社交数据、基于接口开放链接(非基于超链接)产生的APP应用数据、基于多屏同步需求而产生的个人云应用数据、物联网产生的非结构化数据等互联网数据,大多选择了封闭的数据经营模式。三是数据的雪球效应和马太效应同时并存。国际上随着信息搜捕能力的日益失衡,以谷歌、苹果、Facebook等国际互联网巨头为中心的数据单向汇聚正在加速流动,进一步强化了美国等发达国家的信息优势地位。

数据开放利用不仅是美长期国策,而且历来都是美信息资源政策战略的出发点和立足点,在美信息资源国家整体战略结构体系中承担着脚架和支柱的作用。

(一)立法先行,为政府数据开放战略提供法律保障

美政府从数据开放法理设计出发,通过发布一系列法律法规,为数据开放提供坚实的法律实施基础。一是赋予社会公众政府数据获取权,作为推动政府数据开放的公民权利基础。二是设计政府数据开放原则,作为政府数据开放实践的法理基础。依据《1966年信息自由法》,政府数据开放原则为,以政府数据公开为原则、以不公开为例外;政府数据面前人人平等;政府拒绝提供信息须负举证责任;司法具有重新审定政府数据开放事实的权力。三是以国家成文立法,规定政府部门法定必须开放的数据范围。除下列政府数据可以豁免开放以外,政府数据应当无保留全部向社会开放:(1)国防或外交秘密;(2)内部人事规章和工作制度;(3)法定不得公开的信息;(4)第三方商业机密;(5)单位或组织内部文件;(6)个人数据;(7)执法记录信息;(8)金融管理信息;(9)油田地质信息和地球物理信息。

(二)以立法和政策双重工具,推进政府信息资源综合开发和利用

政府信息资源既是国家资源,又是市场资源。美政府通过立法和政策双重工具,不断推进政府信息资源的综合开发和利用。

一是制定发布政府信息资源政策,推动政府信息资源综合开发和利用。1985年制定发布的《联邦政府信息资源管理政策》,从如下几个层面确立了美国政府信息资源开放的基本政策原则:第一,政府数据是有价资产。政府数据是具有重要价值的国家资源,同时也是具有市场价值的商品。第二,政府数据是全民有价资产。保证政府和公众间信息自由流动是民主社会的基本功能,联邦政府信息资源管理必须保证公民对政府信息的获取权利;为推动政府信息资源的综合开发和利用,政府部门应加强信息资源的供给与传播,提高信息资源的可用性和利用率,确保社会公众能够及时充分地获取与利用公共信息,实现美国社会的智力自由。第三,免费供给政府数据是政府法定义务和责任。政府应制定适用于所有格式信息类型的开放政策和方法,以标准化手段提高信息网络系统的兼容性,消除信息资源共享的现实壁垒,保证信息资源能够最大限度地公共免费供给。

二是大力实行“开放透明政府计划”。奥巴马政府伊始,即通过发布一系列政策规划和战略文本,分三个阶段大力推行“开放透明政府计划”。第一阶段是自2009年始至2011年年底,主要是论证和建立“开放透明政府计划”的原则和总体思路。2009年2月,奥巴马政府发布《开放透明政府备忘录》,宣布在政府网站提供更多的互动式资源,吸引用户积极参与政府决策过程的直接互动,以便增强政府网站与用户间的互动性。依据该备忘录,2010年7月,白宫管理和预算办公室发布《开放政府计划》,提出按照开放、参与、合作三原则,推动建立开放透明的政府机构。第二阶段是自2012年始至2013年年初,主要是通过数字政府和电子政务行动贯彻落实“开放透明政府计划”。2012年5月,美政府发布《数字政府:建设21世纪更好服务美国人民的信息平台》,提出新时期美国电子政务三大战略目标、一个概念模型和四大战略举措。

三大战略目标是,确保美国公民随时随地以任何设备获取优质的政府数字信息和服务;确保政府能够适应数字世界新发展,通过智能、安全且实惠的信息技术手段,发展和管理信息技术设备、应用和数据;通过政府数据开放和共享,促进国家技术创新,提高公共服务水平。一个概念模型是,设计由“信息层”、“平台层”、“展现层”三层组成的数字服务概念模型,实现政府数据向公众开放供给的彻底变革。四大战略举措是,采取“以信息为中心”的战略举措,完成由“资料管理”向“开放数据”和“开放内容”管理的转变;采取“共享平台”战略举措,确保信息生产和传输的低成本化、开发线程简化以及标准适用的一致化;采取“以用户为中心”的战略举措,确保美国公众随时随地以任何设备自由接入并获取其所需要的政府数据。第三阶段是2013年以来,主要是通过数据开放和机器可读化战略措施,推进政府信息资源的在线开放和利用水平。2013年5月,白宫管理和预算办公室(OMB)、总统行政办公室联合发布《开放数据政策——将信息作为资产进行管理》,首先确认信息资源的重大战略意义,信息是一种宝贵的国家资源和战略资产,确保社会公众能够自由、无碍地访问、获得和使用信息资源,有益于私人创业、国家创新以及科学家从事科学发现,增加劳动就业,改善并提高人民生活水平。其次提出美国政府的战略行动任务。包括(1)着力开展信息资源的开放利用行动,促进社会公众获取政府数据的量化发展,切实提升信息资源的开放性和互操作性;(2)着力于在全生命周期将信息资源当作资产进行管理,切实降低社会公共服务成本,提高政府信息资源开发利用效率,改善政府服务水平,保护公民个人信息,支援政府任务需求;(3)着力于改进和提升信息资源的收集和创建方式,使得任何既有信息都能支持下游的信息处理和传播活动;(4)着力于提升信息资源的开放性和互操作性,维护并管理完整、可用及健全的内网外网数据资产清单目录,部署信息保护技术措施,明确信息保护管理责任,切实改进信息资源数据库和处理系统的科技水平。最后明确美国信息资源开放利用的战略目标,要构建适用于信息资源全生命周期的信息资源管理框架,切实提升信息资源的开放性和互操作性;确保政府信息资源面向所有社会公众开放,提升美国公众获取特定或不特定政府信息资源的范围和水平。2013年5月9日,白宫发布《实现政府信息公开化和机器可读取化总统行政命令》,要求政府信息资源必须以开放化和机器可读化作为基本形态;政府信息在全生命周期均应作为关键资产予以管理,以提升数据的交互性、可操作性和开放性;政府部门应当确保最大限度最大范围将数据向社会公众予以开放,数据开放的地点和方式应当能够确保社会公众易于检索、获取和使用。

(三)以国家战略形式,推动大数据产业发展

美政府历来视数据为资产,通过国家战略形式,推动各级各类数据进入社会生产生活各环节,培育国家创新体系,促进大数据产业的发展。

一是视信息为资产,鼓励社会各界发掘其中的经济价值。美国立法要求必须将信息资产详细清单作为关键基础设施(CII)的主要内容,同步制作、同步保存。依据《2002年联邦信息安全管理法(FISMA)》,关键信息基础设施的核查和登记范围既包括组成关键信息基础设施的物理设施,也包括支撑关键信息基础设施运行的软件环境和其中存储、管理、处理和维护的各种数据资产。2013年5月发布的《开放数据政策——将信息作为资产进行管理》和《实现政府信息公开化和机器可读取化总统行政命令》,再次要求对数据要按照资产进行管理。在此基础上,美政府鼓励社会各界从日益增长的数据资产中进行经济价值挖掘,如汇聚了美国顶尖大学各类优质资源的大型开放式网络课程(MOOC),面向更多学生提供系统学习,降低了优质教育资源的扩散与传播成本,对提升美国智力自由、推动美国知识创新具有巨大的潜在影响。

二是以政策战略为动力,驱动数据进入生产流通环节。美历届政府均将推动政府数据开放作为其施政第一要务。早在1993年2月发布的《国家信息基础设施计划》中,美政府就提出要“开发利用信息资源”,确保美国公民能够无碍访问并获得政府数据库、图书馆、教育数据、医疗保健资源、娱乐信息服务等各种信息资源。2009年5月,美联邦政府正式启用官方公共数据资源分享网站(data.gov),以便强化信息民主化建设,提高社会公众对联邦政府相关数据资源的搜集和利用能力。2011年5月发布施行的《网络空间国际战略》指出,互联网能够有效提升数字翻译功能,汇聚并向全球开放共享难以计数的知识财富、新思想和辩论议题,采用本土语言记载的各类信息内容能够便利地跨国流动,对于推动数字经济不断增长、人类社会不断发展具有不可磨灭的贡献。2013年伊始,奥巴马政府发布指令,要求由美国纳税人资助的科研项目,其科研成果应当自公开出版之日起1年内免费向社会公众开放。

三是政产学研互动,大力发展大数据产业。政府方面,2012年3月30日,美国白宫正式对外发布实施《大数据研发倡议》,通过系列大数据项目研发计划,增强从大量、复杂的数据集合中获取知识和洞见的能力,提高美国自身从海量数据中挖掘知识价值的能力,以巩固美国在军事、情报、科技、工程、教育等领域的国际领先地位。产业方面,各类非营利机构积极寻求提供基于大数据业务的各类公共服务,美国“数据无边界”组织通过无偿的数据收集、分析和可视化处理,为各类非营利性组织提供帮助;互联网企业和传统大型企业加紧开展大数据市场布局,EMC、惠普、IBM、微软等信息技术企业纷纷通过收购大数据企业来实现技术整合;网飞、Facebook等大型科技公司利用用户遗留在网络上的数字痕迹,通过算法分析用户需求,然后向用户推荐观看电影或者与某人联系的建议。教育科研方面,已经启动大数据应用方面的科研项目,如美国国家卫生研究院宣布世界最大的遗传变异研究数据集——国际千人基因组项目,由亚马逊网站提供免费云计算服务。

受益于信息资源发展战略,美拥有健康有序的信息资源开发利用政策环境和先进发达的数据开发利用产业体系。与美对照,我国尚未制定信息资源国家战略,近10年来未制定信息资源后续跟进政策规划,长期看不利于我国经济社会可持续发展,因此,宜果断行动,尽快研究实施适应我数据竞争能力和大数据战略性新兴产业发展要求的数据开发利用政策法规和战略规划。

(一)制定相关法律法规

建议立法先行,抓紧研究制定《政府信息资源开发利用法》、《政府信息资源管理条例》、《商业数据开放利用条例》等一系列法律法规,明确规定各类信息资源开放的原则、主体、程序、争议解决以及司法救济途径,为信息资源开放创造良好的法律环境。

(二)制定信息资源开发利用国家战略

建议战略规划跟进,在《关于加强信息资源开发利用工作的若干意见》确立原则宗旨基础上,抓紧研究制定信息资源开发利用国家战略,一是以国家战略形式宣布信息资源应具的关键资产属性和形态。依据资产属性和形态针对信息资源进行类型划分,建立针对不同资产属性信息资源的清单目录,对事关国计民生的信息资源进行登记管理。二是推动数据资源建设和开放共享,发展大数据战略性新兴产业。依托搜索、电商、社交等互联网平台及其数据开放策略,推动区域型、行业型和关联协同型的大数据共享联盟的建设,积极发展面向社会提供各种应用和服务的大数据战略性新兴产业。三是确立信息资源开放的基本原则和指导意见。政府数据应以开放为原则、以不开放为例外;专业数据应当向政府数据、其他专业数据免费开放,以合理的价格向商业数据选择开放,国家建立专业数据开放存取出版制度;商业数据应当以合理的价格向用户和其他商业数据进行开放,通过开放数据接口等方式允许其他商业数据在其网内调用其信息、内容、应用及其他网络资源,允许其他商业数据利用指定或自有的开发工具对其进行二次创新开发;个人数据开放应当以本人同意为原则,用户要求支付对价的,应当支付对价,用户对个人数据使用目的和用途提出要求的,应当按照用户要求使用用户个人数据。四是鼓励并引导数据的商业流动和交换。鼓励商业数据面向社会和其他商业数据开放数据接口,引导第三方数据资源开发者和社会力量对数据进行社会化开发、汇聚和整合;鼓励并引导商业数据按照等价支付、有序流动的原则在云架构中进行自由流动,带动整个数据商业价值链的规模化发展。五是在大数据应用和服务领域研究进行关键技术和产业发展的重点突破。启动大数据科学与工程研究计划,在数据库、数据仓库、数据挖掘、商业智能、人工智能、知识内容管理等领域积极布局,形成以大数据实时集成、海量信息处理和管理、云存储等信息技术企业为主体的数据产业集群;鼓励行业用户通过云平台实现数据集中,形成自主可控且能增值利用的信息资产,积极推动大数据产品的行业级应用。六是建设信息资源开放利用的支撑服务体系。推动实施国家宽带战略工程,增强公民获取信息资源的基础设施保障;推动实施国家知识经济战略工程,提高公民获取信息资源的自觉性和主动性,减少公民获取信息资源的经济成本和渠道壁垒;大力开展知识惠民工程和信息技术平台建设,确保信息资源能够以可选方式抵达有需求公民,降低公民获取信息资源的机会成本。

(三)开展数据开发利用相关国际合作

随着数据价值的日益凸显,各种显形或隐形数据壁垒将成为国际贸易中的常态。建议成立相关工作机制,在联合国或其他国际组织框架下,推动并参与数据跨境流动的国际贸易谈判,以双边多边等多种方式,消除境外数据流入境内可能存在的法律或政策壁垒,引导境内数据以安全方式流向具有充分安全保护水平的目的地区或国家,为我国数据跨境合作与开发利用争取较为宽松的国际规则空间。


来源:财新网

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

张钹院士:深度学习优势与短板 中国AI机遇和挑战
张钹院士:深度学习优势与短板 中国AI机遇和挑战
CDAS 2017中国数据分析师行业峰会议程(完整版)
CDAS 2017中国数据分析师行业峰会议程(完整版)
2017年中国AI产业生态报告:中国将成为全球人工智能技术的中心
2017年中国AI产业生态报告:中国将成为全球人工智能技术的中心

我要评论

精品栏目

[2017/06/27]

大数据24小时

More>

[2017/06/19-23]

大数据周周看

More>

[2017/06/19-23]

大数据投融资

More>

[2017/06/19-23]

大咖周语录

More>

[2017/06/19-23]

大数据周聘汇

More>

[2017/06/28-4]

每周一本书

More>

返回顶部