܄

阿里副总裁涂子沛:大数据治国,发展智能社会

【数据猿导读】 信息爆炸的今天,大数据时代已然来临,阿里副总裁涂子沛畅谈大数据与开放社会的关系问题,剖析如何借力大数据,推动国家治理

阿里副总裁涂子沛:大数据治国,发展智能社会

“其实《数据之巅》要比我的第一本书《大数据》站得更高、也更远,可惜至今销量、影响都没有第一本大。第一本有启蒙作用,但大数据战略对社会和国家真的非常重要,必须持续关注。”虽然就任了阿里巴巴副总裁,曾在部队和政府部门工作过的涂子沛还是颇具传统知识分子的家国情怀。给广东的中小企业讲完课,他专门留出了半天时间接受了媒体专访,与记者畅谈了大数据与开放社会之间的关系问题。

读过这两本书的人都知道,里面的内容,很大部分是在讲数据的技术和理念对国家治理、开放社会的重大作用,涂在书中称这种开放为“内开放”(《数据之巅》第215页)。在大数据时代再看历史学者黄仁宇的“数目字管理”,除了在治理技术上的精细化,更多了譬如隐私权、数据开放、数据标准等等新含义。涂子沛说:“要让黄先生地下安心,需要这套东西在中国变成现实”。

万物皆数据

“现代人越来越离不开手机,早上起床第一件事、晚上上床前最后一件事,往往都是看手机,看手机其实在看信息,看信息其实在看数据,人们离不开的,其实是数据,今天“1234”是数据,朋友圈里的一张照片也是数据。数据就是对客观世界的测量和记录。人们可以随时随地把所见所得变成数据,数据因此开始爆炸,同时有越来越多的工具可以记录事件,可以把任何所见所得立即变成数据,这是大数据时代和以往的本质区别。”涂子沛对大数据做出了通俗的解释。

在刚闭幕的十八届五中全会公报提出要实施“国家大数据战略”,这是大数据第一次写入党的全会决议,标志着大数据正式上升为国家战略。

在战略层面,涂子沛认为,这至少涉及三个层面的问题:一是数据的开放和安全;二是数据的标准,各行各业的数据都应该有标准;三是数据是战略资源、处理数据的人才也是战略资源。

因为人们在记录世界,可供“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,新的交叉领域,重新构造供需,创造目前难以想象的新价值,带来“大知识”、“大科技”、“大利润”和“大发展”,无论是在商业领域,还是国家治理领域。

黄仁宇指出,中国的落后,根源在于整个社会没有发展出“数目字”的管理体系,数目字管理就是数据化的管理,这个观点,在涂子沛看来,至今仍有借鉴意义。

黄仁宇讲的“数据”与“大数据对比”,前者偏重于统计和测量,原来是要用科学方法去统计、测量,其结果是数据,而后者更多的是记录而非测量,这些数据是记录事件而不是测量事件。

“我的第二本书《数据之巅》有相当的篇幅在沿续这个话题,中国社会没有发展出数据化管理的体系,和我们的文化有关,中国人善于含蓄、模糊的审美和联想,止步于用逻辑来分析、用数据来证明,所以我认为当下的数据爆炸其实也是一个发展新文化的契机,所以我提出要抓住机遇,建立普及数据文化。数据不应该仅仅是个技术符号,还应该是文化符号,特别是对我们民族来说。数据文化是提倡数据、基于数据的文化,是尊重事实、强调精确、推崇理性和逻辑的文化。”涂子沛强调。

大数据治国:GDP水分、公共决策与财产公开

小数据时代,各国政府都面临着数据虚假问题,数据出政绩、出官的现象相当普遍。由官僚体系层层收集上来的数据,每一层部门都会根据自己的意愿、根据官场竞争逻辑对数据进行“拿捏”,水分因此产生,非民主国家因为不透明,这种现象更为突出。大数据的方法和技术,对解决这个问题有很大的帮助。

大数据的真正杀伤力,其实并不于表面的大,而在于“多源”,即有多个源头的数据,相互应证,是一种多元化。比如说克强指数:工业用电量新增、铁路货运量新增和银行中长期贷款新增的结合,这些数据,都可以去印证GDP真实的发展水平。

这种印证的技术还在不断推陈出新。例如,有公司通过收集卫星照片,观测中国建筑工地上脚手架的影子,来分析中国建筑行业是在繁荣上升还是在萧条下降。一家叫Orbital Insight的公司,就分析了中国30个城市的卫星图,为开发商们提供独家数据,而这些公司,可以不再仅仅依靠政府提供的数据。同样的道理,也可以通过分析庄稼地的卫星图来预测庄稼的收成、长势,通过分析停车场的数据来初步预测一个商场的销售和收入。

在大数据的时代,官员或企业管理人员人为捏造数据的道路将越来越窄,最终行不通,多方面数据同时指向一个问题,如果捏造数据,会千疮百孔,各种相互矛盾将会越来越多的展现在众人面前。

具体到公共决策体系层面上,涂子沛提倡“数据治国”,因为大数据是当下推动国家治理现代化的一个重大契机。数据是量化的结果,量化,是人类进行科学研究最根本的手段,就此而言,数据治国也可以理解为“用定量分析、实证研究的科学方法来治理国家”。

所谓治理现代化,就是要认识到,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志,过去深入群众、实地考察的工作方法虽然仍然有效,但对决策而言,系统采集的数据、科学分析的结果更为重要。今天的数据时代,强调的不是静态的数字,而是动态的数据、系统化的数据、以不间断“流”的形式存在的、成片的、活的数据,它们应该成为公共决策的资源为政府和社会广泛使用。

政府的行为和人的行为都会被精确记录。政府在做项目决策时,知道这个数据要公布出去,要被质疑,其官员的行为就会发生改变,会更慎重对待数据,数据也会反过来影响政府的行为,互相反馈。在一些发达国家,公共财政预算、项目计划、官员财产公开这些问题已经进入了数据开放的领域,而不仅仅是“公开”。

但实际上,数据开放和信息公开这是两个完全不同的概念。简单的说,公开是信息层面的,是一条一条的公开;开放是数据库层面的,是一片一片的。公开即告之,是知情权的载体,而数据开放是将原始数据以机器可读的形式放在互联网上,让别人一下载就可以自由使用,它是技术层面的,是为了让社会更好的使用数据资源,推动经济发展和社会创新。例如公共财政公开、官员财产公开,今天很多国家已经不是把一个数据结果告诉大众,而是把整个公共支出的数据细目以数据库的形式放到互联网上,以供大众分析使用。

数据开放,在涂子沛看来,本质上是一种内开放。一提开放,很多人想起“对外开放”,其实内开放更为重要。当下,对数据开放也有很多理解的误区,例如很多人认为开放就意味着“免费”,其实企业的数据,也可以以收费的形式开放。开放也是有层次的,可以对某个群体、某个组织,也可以对全社会开放。

在大数据的时代,开放数据的意义,更在于让数据这种生产资料流动起来,以催生创新,推动知识经济和网络经济的发展,也可以促进中国的经济增长由粗放型向精细型转型。

大数据时代也是对社会关系、个人社会地位的挑战。数据开放是信息的自由流动的一个高级阶段。整个信息当中具有结构化、体系化,最有价值的信息表现为数据,当他们开放时,就不仅仅是信息流动了。数据如果是开放的,就代表知识是开放的,权力是开放的,为开放社会提供了真正的基础。

开放社会的内涵就包含了对权威的挑战,给普通人提供自我做主的可能空间。今天数据越来越多,每个普通的人都能获取知识与科学,曾经只有特权阶级、精英分子能够去解读的东西,普通人今天也可有自己的理解、进行解读。即个人可以通过自己所掌握的信息做出选择和判断,这样能促使社会不停地进步。

但由于信息过多、传播速度快,超出了一个人可以处理的能力,确实也会出现集体平庸、随波逐流的问题。

人类新挑战:丧失隐私权

王飞跃先生曾提到,由于人的行为被精确记录,与现实的你对应,一个“虚拟”的数字化的个人,会在网络空间被立体而丰满地建立起来。网络世界会成为与“现实世界”互生、互变的一个强大世界。

对此种现象,涂子沛称之为现实世界的“镜像”,现实世界在时间的维度上,转瞬即逝,但通过数据,留下永久的痕迹,其基础是人的行为被大量记录。最早的互联网将机器跟机器、跟人互相联接起来,而今天早就超越了这个阶段,其实叫互联网、网络世界已经不合适了。

今天,无数数据在互联网上沉淀,互联网本质上已经成为沉淀数据的基础设施。把商业过程数据化,在互联网沉淀下来,企业就可以去分析、去预测自己的消费者群体。涂子沛指出,这是传统的企业跟互联网企业最大的区别,即数据化,传统企业没有用互联网这个东西来沉淀自己的数据。

不仅仅是互联网,万物互联,未来五年或十年,我们的生活也许是在一个“虚拟与现实彻底打通的世界”里,而这个世界里,现实与虚拟的边界将会变得模糊,基于大数据的各种自由应用,可能会大行其道。

值得注意的是,这个数据世界、虚拟世界不仅和现实世界平行,而且会反作用于现实世界。政府,企业,个人都是如此。不仅“公务员”的收入与消费会被记录,普通人的行为、念头、购物记录,也都在被全方位记录。一个婴儿,甚至从娘胎里,就开始被记录了。出生后,家长会用各种记录工具来记载他的成长轨迹。孩子长大,又会自己记录。这些构成从摇篮到坟墓的数据和记录。例如今天的微信,从你使用的第一天开始,所有的对话都会保存在云端,将永不消失,理论上,子孙后代万年之后还可以看到。

而对于这个数据世界中的个人隐私问题,涂子沛在第一本书《大数据》里,就曾写过一个案例,美国某地区新安装的ATM提款机数据记录出现了异常:每天午夜12点到2点之间,有大量的款项被提取。银行担心这涉及诈骗,进行监控和调查之后发现,原来该提款机靠近一家色情俱乐部,顾客来这里提取现金,是为了不在信用卡上留下“不体面”的消费记录,但欲盖弥彰,提现的数据反而泄露了隐私。

这还只是单个数据的检测记录。如果更多元的数据被检测和记录,每个人都可能成为透明人。一旦多个源头的数据一整合,隐私更麻烦。当你在银行存钱、提款的时候,你留下的信息绝不仅仅是一笔银行交易,其实你还告诉了银行,某一时刻你所处的地理位置。这些信息,很可能会成为你其他行为的解释,从而透露你的隐私。设想一下,你的每一笔提款记录,如果和你当天的通讯、消费、旅行等其他数据记录整合起来,你当天的行踪和作为,就不会有太多的秘密可言。

在大数据时代,计算机内的每一个数据、每一片字节、都是构成一个人隐私的血肉。信息加总、数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候,是大于2的。

所以保护隐私,就要捍卫你的数据。

公众参与:“我的数据我做主”?

吃、穿、住、行、用、玩,现代人几乎每个环节的活动被网络覆盖,怎么保护个人隐私成为了大数据时代下每个人的痛点。

涂子沛认为,隐私保护的意识,我们比西方社会要弱,但大数据时代的到来,把我们带到了几乎和西方社会平齐的起跑线上,要保护好隐私,必须建立“我的数据我做主”的基本原则,即因你而产生的数据,要怎么用是自己说了算,不是银行、商家、医院说了算:公司、商场、银行、医院和政府在收集数据时,要做出申明和承诺,收集这个数据用于哪些用途,除了这些用途之外不能乱用。归根结底,谁想用你的数据,应该经过你的允许。

智能社会,正在发生的未来

开放的政府、开放的社会是人类能不断向前发展、获取更大自由的根本动力。现阶段,大数据、云计算、人工智能、虚拟现实技术融合在一起,大数据的终极意义,其实是在引导我们走向智能社会,智能的载体和来源就是数据。当我们对数据赋予背景时,它就成为信息;信息是知识的来源,当把信息提炼出规律的时候,它就上升为知识;知识是智能的基础,当电脑、网络能够利用某种知识作出自动判别,采取行动为人类服务的时候,机器智能就产生了。

所以数据化是基础,只有越来越多的商业过程变成数据,这个过程才可能智能化,即由机器来自动处理,这种处理不仅效率更高,因为减少了人工干预,还更公平,即控制了腐败。例如,阿里巴巴的电商平台上做促销活动的时候,要选品,即确定那些商品可以上活动,以往阿里巴巴都是由小二说了算,小二自然有很大的权力,店家就要巴结小二,现在,阿里正在根据数据设计算法,改由机器自动选品,这很好的解决了、杜绝了腐败问题。

所以我们提出:一切业务数据化,即把所有的业务过程都记录下来,在数据上形成闭环。这是智能化的基础。智能时代的特点,是无处不在的计算机和网络将像有智商的人一样为人类工作和服务。换句话说,越来越多的工作将被计算机或者机器人所代替。

此外,由于精准的计算和预测,社会的很多个部分都可能像无数个大大小小的齿轮轴承一样,环环相扣,齿齿吻合,日常管理通过数据更加优化,各种任务、合作可以无缝对接,社会运行的成本可以大幅降低。

当然,这是从局部开始的,先从重复性的工作和常规性的工作开始,我相信,机器永远无法取代人类,但这种取代也将极大的提高效率、将人类从大量重复性的工作当中解放出来。

虽然人在大部分情况下不能被精确预测和计算,特别是当他知道他在被预测、被计算的时候,但社会总体上可能呈现一种规律,即预测的层面范围越大,才可能越准,智能化只能局部的解决问题,但会大量广泛的存在于我们未来的生活当中。


来源:智客

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

旅游交通大数据——大众旅游时代的“富矿”
旅游交通大数据——大众旅游时代的“富矿”
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
张涵诚:大数据招商平台可推动地方供给侧改革
张涵诚:大数据招商平台可推动地方供给侧改革

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部