܄

在中国,科学家的研究工作往往受制于数据的获取!

【数据猿导读】 在中国的当下,公共数据的开发与分享收到了来自各方越来越严重的约束,这种约束力正在限制着每一个中国科学研究人员的发展,如果这个问题得不到解决,日后必将限制中国科学技术的发展

在中国,科学家的研究工作往往受制于数据的获取!

中国科学家在获取重要研究所需的高质量公开数据的道路上越走越艰辛

大数据元年之际,我们很荣幸赶上了生物信息学数据库的发展,我们有幸和各界同仁分享有价值的数据信息,同时我们也遇到了大量获取技术资源的机遇。直到现在,开放科学的发展趋势正在帮助中国科学家登上世界的舞台与来自全球的同行们相互切磋。但是在中国的当下,公共数据的开发与分享收到了来自各方越来越严重的约束,这种约束力正在限制着每一个中国科学研究人员的发展,如果这个问题得不到解决,日后必将限制中国科学技术的发展。

对于中国科学家而言,高质量的国内数据资料的获取岂是一个难字可以形容的。大部分的公众数据都掌握在政府部门的手中,甚至有些部门已经把持数据的垄断权势,这让研究人员对数据的获取变得雪上加霜。这尤其会对人文与社会科学的研究人员产生研究的影响,但是这种影响会逐渐扩散到环境科学和公共健康领域,因为和这些领域相关的数据往往带有政治敏感性。比如说,我经常在一些研讨会上听到来自同行关于从大气污染物水平提取日常数据时所遇到的困难的抱怨。

即使有些数据向大众公开了,但是很多数据质量参差不齐,这主要是因为最初数据的收集工作并没有很好的开展。最值得大家关注的案例就是中国备受争议的国内生产总值(GDP)数据。在国家官方估算的数据和中国31个省级地区上报的每一个省份的GDP数据计算总和之间存在着很大差异。位于北京的国家统计局承认不同的省份地区使用的数据收集方式几乎是不同的,而且国家统计局正在想办法让个地方收集数据的方式方法协调一致。但是迄今为止,官方做的改进收效甚微。

确保网络安全对于国防来说至关重要,但是优质的数据是科学进步和经济发展的根本。

公共数据的分享现在已经被制定成一种盈利方案。这种做法会有益处,比如说,我们可以编写一部关于中国公路车辆尾气污染数据的方案。如果实施方案恰当的话,这需要我们获取关于每一种车牌号种类的数量的详细记录、交通阻塞情况、详细的发动机参数以及燃油标准等各方面的信息。研究院力争从公共机构获得关于车主的最基本数据,因此他们不得不使用那些由实业集团从生产商那里收集的不是很严格的,有时候甚至是误导性的销售数据。讽刺的是,这些同样富得流油的鼓吹自己销量的机动车制造商可以通过和政府部门有关的特殊渠道购买关于竞争对手的可靠数据,而他们购买这些数据所花费的价格是这些研究院和科学家们怎么也无法承担得起的。

在这样的大环境下,难怪有些科研团队不想公开自己的科研数据。数据的所有权意味着这写无形的文化资产可以为科学家在某些学术领域带来很强的竞争优势。我的科研团队受到很多关于索取海运数据的需求,比如说港口统计数据和舰队信息等,但是我们实在是很不愿意和别人分享我们的数据。我们将这些零散的数据进行整理和分类所付出的劳动量和代价是及其巨大的。如果我们将这些数据仅仅供我们自己使用,我们可以根据这些数据创作新的研究论文。

公共数据的免费获取以及数据质量的提升对政府事务透明性的提高会有很大帮助。尽管这方面的进展极其缓慢,但我们还是可以看到一些积极的案例,并且这些进展已经让中国社会受益匪浅。值得我们留意的是在2014年发生的关于环境污染数据的公开事件,此次事件为环保部门带来了相当大的公共压力。在这之前,只有非常粗略的数据向外界发布。但是现在的环保数据每小时就会更新一次,并广泛地被中国的政府机关分享。这些环保数据可以让卫生局根据数据的变化向民众发出健康预警信号,而教育局会根据数据变化决定是否可以在雾霾天气让学校推迟上学时间,交通局可以调整自己的交通管制计划。但是环保数据信息的公开所带来的最大益处就是让广大人民意识到了环保势在必行。

这些局限性不仅仅发生在信息的形成环节,信息的持有问题也遭到了质疑。国外学术资源也可以通过技术手段获取。几家信息管理局已经建立起数字传输通道路障,对蓄意有害信息进行过滤。

作为一名科研工作者,我在中国的研究生活也受到的影响。学术文献资料的可靠搜索结果几乎为零。因为我们无法获取谷歌学术搜索引擎,因为该引擎包含了各种书籍、论文和技术报告,我不得不通过查找数据库的方式紧跟科学发展趋势。

确保网络安全对于国防来说至关重要,但是优质的数据是科学进步和经济发展的根本。资源共享和公众对可靠数据的获取可以巩固经济和社会健全成长。在中国,解决这个问题会牵扯到广泛的研究工作,因此我们需要建立一个高效并且合理的数据管理机制让全体人民获益。但是首先,迫在眉睫的问题就是要让广大科学研究人员可以获得搜索学术文献和相关数据的入口。


来源:化学数据联盟

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

相关精彩内容推荐

我要评论

精品栏目

[2016/10/10]

大数据24小时

More>

[2016/09/26-7]

大数据周周看

More>

[2016/09/01-30]

大数据投融资

More>

[2016/11/04-11]

大咖周语录

More>

[2016/10/31-7]

大数据周聘汇

More>

[2016/11/01-6]

每周一本书

More>