加拿大数据开放平台data.gc.ca对政务数据的公开有什么启示

【数据猿导读】 联邦政府数据公开湖的入港口已经部署。这意味着,整个加拿大政府公务员系统中,谁拥有想和大家分享的数据,通过data.gc.ca转入互联网,已成为新政策体系的一部分。从data.gc.ca身上我们可以看出,更多的政务数据开放,可以完善问责制,可以增加透明度,可以促进企业与社会创新...

加拿大数据开放平台data.gc.ca对政务数据的公开有什么启示

那些看过推特的人早已经知道,我将行权举办记者招待会,宣布data.gc.ca的上线。这是联邦政府数据公开湖的入港口。对于那些想深入了解数据开放和探究为什么这很重要的人,我的建议是这个网址,这篇公告以及这篇文章——他们列出了一些数据开放极其重要的原因。

这次发布会,我想回顾一下data.gc.ca项目的启示与教训。

启示

关于data.gc.ca的重要议题

也许关于data.gc.ca最重要的议题是现在联邦政府数据公开湖的入港口已经部署。这意味着,整个加拿大政府公务员系统中,谁拥有想和大家分享的数据,通过data.gc.ca转入互联网,已成为新政策体系的一部分。这是中央机构行政许可放权的重大信号。通过入港口接入体制,大量给予那些需要数据共享许可权的人,一个流程标准化的、高速化的数据传播途径。由此可见,data.gc.ca自身的意义重大。

事实上,我被告知,已经有许多部门和私企都被要求开始接触并操作data.gc.ca来分享他们的数据。这样的结果类型正是我们作为公民应该想看的。

另外,我听说政府要将接入data.gc.ca的部委和数据量翻倍。所以这给我们的另一个启示是政府承诺将其发展壮大。我认为这是很重要的,很有意思。尽管有一些数据公开湖的接入港已经大张旗鼓的高调展开,但也仅仅是一些数据没有源泉的,不可持续发展的信息孤岛,必将被时代所淘汰。

进展

成果如何

辩证的说,“数据湖中的金矿”依旧是稀缺资源。因此我觉得,必须对U2U异化模式中构建价值制高点的基础时刻保持谨慎的态度。就是说,清澈的数据湖将给加拿大带来波澜壮阔的影响:预算数据,项目部花费数据(如英国),食品检验数据、产品召回数据,加拿大统计局网站(http://www.statcan.ca/)的每一个信息,加拿大服务中心的坐标,邮政编码集,邮箱地理信息,商业许可证信息,税收信息,慈善机构和公开上市交易的公司信息,只要是能想到的,我还能再列举出很多以及更多……

我认为那些透明产业,技术产业,创新产业,移动产业和线上服务团体未来将更加密切的关注data.gc.ca,来看我们在数据湖中搞了什么花样。而精髓的地方是政府也将要求人们来反馈他们需求在数据湖中看到什么样的信息。我个人强烈鼓励人们让政府知道他们想看什么,特别是当人们的需求涉及到政府已经分享过的数据时,人们获取了一种无法使用的格式。

教训

一个词:许可证

许可证漏洞深深的打击了data.gc.ca。有些人到目前仍然沉迷在老生常谈的观点,许可证不允许数据开放——这种批判,我认为是公平的。但我想要表达的是:现如今的data.gc.ca数据公开许可证可以有效的灭掉商业创新的任何可能,并限制各处数据被精准控制在非盈利领域的使用。

这条线是第一个,同时也是最大的阻碍:

“在加拿大政府看来,可能损害本国形象或曲解本国声誉时,您不得以任何方式使通过GC数据公开湖入港口获取的数据不失效“。

这是什么意思呢?这是否意味着任何从data.gc.ca获取数据的记者,在文章撰写时,批判政府行文的论调,都是公然违反使用条款?这种情况是可能会出现的。从问责制和透明化的角度看,这是致命的问题。

从商业的角度来看,它也存在问题。如果有人想使用来自data.gc.ca的信息资源去帮助身边的人,那么在利用这些政府提供的信息时,他有可能会得到一个好的结果,但如果得到一个坏的结果,是否算违约?这个问题实质上是条款的隐性逻辑与约束,使那些意图利用这些数据的企业审视其所必须承担的代价。

更新:3月17日星期四,下午3:30,部长打电话通知我,他们将从纸面上废除这一条款。这是一个令人振奋的消息,同时data.gc.ca的快速行动也受到了财政委员会的称赞。这也是极大的认可,这是一个充满希望的试点(如β阶段)项目,这里提及的一些其他问题,在下面的评论中也将得到解决

这样的条款毫无价值,世界上没有其它任何一个数据公开湖入口港有这样的条款。

第二条战线是:

“除了重新编译软件兼容的特定目的,你不得反汇编,反编译,或试图以任逆向方式激活data.gc.ca所提供数据的任何部分。你不得将来自于data.gc.ca的数据合并或链接到任何产品或数据库,来识别个人信息,家庭信息,房主信息或者以这样一种方式,来加持你已经收到的或者获取的,由加拿大官方政府持有的个人信息,家庭信息,房主信息、组织信息、或商业信息。

然而当我知晓了这条线的意图,该条款的不稳定性出自于几个原因。首先,许多的商业模式依赖于识别个人身份信息,甚至商务过程中频繁的出现个人身份识别的商调问答。举个例子,比如谷歌,基于数据库中已知的个人信息,他们知道我是谁,他们向我推送私人定制的服务。那么推行该条款将抵制谷歌使用加拿大政府的公开信息,来改善他们已经经过我本人同意的私人定制服务。此外,数字经济的未来是围绕提供私人定制服务。而这个已经被数字化处理的有效数据,它不再属于数字经济领域的一部分。

更令人不安的是,这些条款不仅适用于个人,也约束了组织和企业。这意味着你不能用数据来进行业务“识别”。在Emitter.ca上面,我们使用来自加拿大环境部市政设施的公开数来展示公众周围的环境污染。由于我们需要对市政公共设施和它周围的企业进行身份信息验证(当然也包括和这些设施所属企业有牵连的政客们),我们是不是违反使用条款了?与此类似,我曾经谈过如何利用政府数据防止$3B的税务造假。坏消息是,数据一旦通过data.gc.ca,将确保不可能被进行修改,但为了确认税务造假,你又不得不对卷入其中的慈善机构进行身份信息核实。因此,该条款的要求显然破坏了数据产生后的一切使用职能。

又是这样的条款,毫无价值,世界上没有其它任何一个数据公开湖入口港有这样的条款。

最后:

4.1 你应保管并维护所有从data.gc.ca复制的数据有效性,生产需参照上述第3节,并遵循如下事项:

复制并传播加拿大政府的许可证。

4.2 任何使用data.gc.ca数据并包含附加值的产品,你应当在产品的显著位置添加如下声明:

本品产自(你的名字–或公司名称,是否适用),数据信息由加拿大政府提供产品内置加拿大政府公开数据信息不被视为构成加拿大政府产品代言或任何其他由加拿大政府书面批准的通知, 这里的问题是,这造成我们所说的“纳斯卡效应。”当你使用越来越多的政府数据,数据归属的“突出”显示开始堆积。如果我正在使用3个不同的政府数据,每个数据都需要突出显示归属,你很快会看到到处都是数据归属声明,而不是你正在寻找的地图或其他信息。在这里,我更详细地概述了此问题。英国政府已经找到了更好的处理办法。

事实上,说到英国的联邦政务数据开放许可证,我真的很希望我们的政府只需要把它大批量复制过来就行了。我们有一个和联邦类似的政府制度和法律系统,所以我不明白为什么不直接拿它来加拿大。这事从根本上比搞data.gc.ca要好,通过它,我们可以在多个国家政务体系内共同走向一个联邦许可证,这将是一个真正的胜利。当然,我更喜爱data.gc.ca,如果我们能采用公共领域贡献许可证体系(PDDL),而英国政府开放许可证只要能用就行了。

总结

data.gc.ca的推出是重要的第一步

对于我们这些有志于数据开放和政务开放的人,它就像一辆车辆,通过它,可以获得更多的数据开放,可以完善问责制,可以增加透明度,可以促进企业与社会创新。尽管说,还有很多工作要做:获取更多的数据积累,对解决许可证问题的疑虑有着重大意义。我曾与国库委员会主席Stockwell Day说起过这些问题,他很感兴趣,但我希望有更多的人表示他们的关注,并更好地了解部级和政治工作,我们落地正确的许可证并帮助找到改善网站和程序的方法。这就是为什么我们在高科技的世界展开公测,希望这能成为政府将要做的一些事情。


来源:国脉研究院

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

相关精彩内容推荐

我要评论