܄

现阶段我为什么不看好纯粹的数据交易?

【数据猿导读】 原力大数据创始人江颖表示,尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因为现阶段的数据交易缺乏了必要的基础构建

现阶段我为什么不看好纯粹的数据交易?

来源:数据猿 作者:江颖

导言:

普通人发现,自己的隐私在不断被暴露,不是房屋中介就是股票推荐;

一般企业会说,“大数据就是骚扰电话和短信”、“能不能帮我找到客户发短信、打电话”;

业内人都清楚,现阶段大量的数据交易实际上就是客户隐私数据和敏感数据的出卖,并且已然催生了庞大的地下产业链;

现阶段的 “数据交易”,多限于个人身份、企业基础信息的核实验真,而更多的是客户隐私数据的黑市交易。

尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因为现阶段的数据交易缺乏了必要的基础构建。

一、普遍缺乏大数据认知,不知道大数据能做什么

在大数据产业中最重要的因素是人,而在数据交易中,交易双方必须对数据有清晰的认知、理解。但在现阶段,大数据刚刚起步,绝大多数的行业、企业对于本身数据、数据如何使用并不清晰。所谓认知理解基础,指的是知道“我能用数据做什么”、“别人的数据对我有什么作用”、“我的数据对别人有什么作用”等等。

理想的数据交易是数据提供方与需求方能够进行对接,解决企业之间的数据缺失问题,完善数据价值。但大数据的能力和价值是抽象的,大部分是非直接的,这就导致很多人对数据价值的认识不到位,甚至不同位置的人之间也存在着严重的断层。

很多时候做搜集数据工作的人不知道拿数据做什么用,作数据分析的掌握不了数据质量,营销策划人员不知道数据能够帮助他们做什么,管理者会发现大数据的应用没有达到预期的效果。

再者,对于数据交易这个前所未有的领域,作为数据提供方、数据需求方或交易平台管理者,不同的角色该怎么发挥自己的作用,大家能够促成什么事情,其实很多人在思想上都是没有做好准备的。

二、缺乏数据交易基础,高质量数据拿不出来

口径不一致,有数据却用不了

数据口径必须要极为明显、确保一致,才能保证后续高效利用。在建模分析中,对于所研究的变量,必须搜集、整理其时序的或某个时点的横断面数据资料,它们是建模的物质基础。这些数据资料的质量,直接关系到模型的质量,影响我们对数据的应用。

然而,大数据对于大部分行业都还是新鲜事物,部门、行业间存在严重的数据壁垒和孤岛现象,很多数据口径不明晰,别人读不懂你的数据;又或者同类数据口径不一致,没有办法合并同类项。

就拿大数据征信举例,不同部门的信用评级标准不一样,很可能对于同一个的评估结果就有天差地别。这时候该相信谁,该采用谁的标准?大数据本应是告诉你答案的,而不是让你陷入新的难题。但如果没有明晰、一致的口径,数据就不能帮助我们解决问题,数据交易又有什么意义呢?

数据拿不出来,躺着睡大觉

数据交易要发挥作用,必须要有高质量数据集的参与。但众所周知,越是高质量的、具有核心竞争力的数据,就越是容易涉及信息安全、信息敏感等问题,因此越是被高度保护、无法获取。

几乎每天新闻都会曝光非法的数据交易,利用各种社交工具售卖学生个人信息、银行卡卡号密码等等。明明是非法的勾当,却还是有那么多人以身试法,正说明了目前正规交易市场的数据其实远未能满足商业需求。

数据交易不应该触碰到用户个人隐私信息、敏感信息这条红线,那如何在不触碰红线的前提下,输出数据的能力,跟其他数据进行拼接,这是我们需要长时间不断探讨的问题。而现阶段的数据交易并没有办法释放这部分的数据能量。

可读性不足,数据形同虚设

我们有个客户,手头上掌握的数据能够帮助同行业的一些企业来做精准营销,但他的数据既有文本、又有数字,且规范性差,可读性非常的弱。有些政府数据也是如此,虽美其名开放数据,但数据孤岛、数据结构性差等问题大量存在,没有办法被机器读取。

像这样的非结构化数据其实不在少数,而且大都蕴藏着巨大的价值,但需要大量的时间、人力物力去做清洗、处理。这些基础工作在现阶段并没有做好,所以数据也就难以实现拼接和大规模流通。

三、缺乏制度基础,交易环境不明朗

数据交易下,隐私和安全问题是社会最关注、最敏感的问题。随着大数据时代的到来,过往的法律法规并不能简单地套用到数据交易的场景中,需要制定特定的制度、法规。否则数据交易将会长期处于一个尴尬的境地,进退两难。

此外,行业与行业之间、企业与企业之间目前仍然没有数据互通的意识或共识,大家对于自己所拥有的数据还是持十分谨慎保守的态度。但未来这种态度必须要转变,因为跨界数据的整合才能够带来大数据应用的爆发。

四、数据交易要蓬勃发展,把数据“拿出来”是关键

我认为数据交易是趋势、是未来,但由于不具备上述基础,现阶段还很难发展。在这些基础之上,最本质、最核心需要解决的是高质量数据“拿不出来”的问题。所谓“拿不出来”,意思是数据变现必须运用间接的方法,而不可能通过纯粹的原材料买卖来变现。

要怎么把数据“拿出来”,第一,必须要形成一套口径统一的标签体系。通过长期摸索,当标签极其规范时,我们就能够以标签化输出代替原始数据输出,信息孤岛才能够被打通。

第二,是要形成行业与行业、企业与企业良好的信息共享机制、保密机制,完善的法律法规,数据交易才能够顺利地进行,健康发展。

同时,像我们做大数据的公司,其实还肩负大数据普及教育的使命——提升大数据意识,培训大数据能力,激活企业大数据资产。要告诉企业大数据是什么,能帮你做什么;然后深入探讨交流,分析你所具备的能力,有什么需求;还要给企业做大数据培训,做能力建设等。

结语

我曾经提出“技术不是大数据第一生产力,数据交易才能带来应用的爆发(链接)”,但数据交易绝对不是纯粹的数据原材料买卖,否自在未来将会丧失核心竞争力,借助大数据做一些现在做不到的事情,才是大数据交易蓬勃发展的未来!


作者简介

江颖,帷策智能、原力大数据创始人兼CEO,大数据应用实施领域资深专家,中国大数据商业实践先行者。自2003年起,一直致力于大数据领域的研究及应用实践,深度涉入通信运营商、移动互联网、零售、服装、教育等多个行业,拥有大量的行业经验和研究成果。

注:本文由 原力大数据 投稿数据猿发布。

欢迎更多大数据企业、爱好者投稿数据猿,来稿请直接投递至:tougao@datayuan.cn 


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

相关精彩内容推荐

我要评论

精品栏目

[2016/08/25]

大数据24小时

More>

[2016/08/20-31]

大数据周周看

More>

[2016/08/06-10]

大咖周语录

More>

[2016/08/06-10]

大数据周聘汇

More>

[2016/08/06-10]

每周一本书

More>