܄

技术大咖硅谷行:不同角度为你剖析Airbnb如何打通数据价值链?

【数据猿导读】 百分点集团技术副总裁刘译璟近期走访硅谷,包括FaceBook、Airbnb、Google,以及一些创业企业,在面对面交流大数据技术中获益匪浅,尤其是对Airbnb的印象最深

技术大咖硅谷行:不同角度为你剖析Airbnb如何打通数据价值链?

百分点集团技术副总裁刘译璟近期走访硅谷,包括FaceBook、Airbnb、Google,以及一些创业企业,在面对面交流大数据技术中获益匪浅,尤其是对Airbnb的印象最深。

这家08年成立的企业被媒体曝光很多,被称为数据驱动业务的典范。其实,它之所以如此受追捧,不仅是因为今天Airbnb已经扩张至全球191个国家,估值超过240亿美元,还有更深一层的原因。

Airbnb最有特色的一间办公室

今天要讲的就是Airbnb的数据理念和组织架构中的奥秘,剖析数据科学家团队如何帮助它打通数据价值链。

历数硅谷成功的互联网公司,像FaceBook、Google这样的企业,是典型的技术型企业,并且是技术驱动业务;而Airbnb本身是依靠产品、设计起家,非常强调业务。Airbnb的技术体系主要是基于开源技术,并恰如其分地应用到自己的业务里。凭此,才真正可以称为是实现数据价值的案例。

回看国内,在互联网公司里面,有很多的企业都是依靠数据产生价值的,比如阿里,一直号称自己是一个数据公司,而不是一个电商公司。

但在一些传统企业中,百分点发现了一个共性问题——传统企业在数据转换化为价值上面临很大的困难。比如掌管数据的科技部门把平台搭建好并收集数据后,业务人员往往没有应用起来;业务部门也面临这样的情况,对于非业务化的数据完全看不明白。

这个问题的核心,是数据价值的实现链条上的出现了业务、人才和技术的缺失。

“内嵌”在Airbnb的数据科学家团队牛在哪?

通过与Airbnb的基础架构数据部及数据科学家沟通,我们画出了Airbnb的业务架构图。

Airbnb数据科学家团队的组织架构特点是:嵌入式为主,集中式为辅。

2008年Airbnb初创时只有七个人,当时人们对大数据的价值追求还不像现在这么狂热,通常情况下会在公司成熟以后再建立数据团队。然而Airbnb创始人非常具有前瞻性,公司成立初期就迫不及待地着手筹建自己的数据团队,并通过数据驱动业务产品线发展。

现在,Airbnb已经发展到的10多条业务线,每条业务线里都有自己的产品经理、设计师、工程师,以及相关的运营人员。条线里面重点囊括了数据科学家团队,并且,这些数据科学家全部都直接部署在各个产品线里面,这就是Airbnb实现数据价值转换的关键。

支撑这些数据科学家团队的是什么?

包含两个组织,一个是数据基础研发部门,负责基础产品研发;另一个是数据研究研发部门,统管了Airbnb所有的数据。这两个部门综合起来就是基础架构,下面的基础架构的数据部门是集中式的,但是任何偏向业务的数据,都是直接进入到业务线里的。

Airbnb主要是在挖掘自己的数据,而没有借助第三方。这也说明对第一方数据的充分利用有非常大的潜力。

Airbnb实现数据价值的想法,实际上跟百分点的理念非常像。百分点在去年9月8号发布了 “+大数据”模型的BASIC模型,包括核心信念、架构设计、专业团队、基础设施和机构能力。结合Airbnb的发展实践可以这么阐释:

B:创始人不仅具有前瞻性,目前Airbnb在全球大约有2300多名员工中,数据科学家团队就有200多个人,比例达到10%之多,说明Airbnb对数据驱动业务的重视程度。

A:概括来说,Airbnb的架构中,数据基础部门是把企业里所有的数据集中起来,构建统一的数据收集、标签化、标准化,以及建模、实验平台;数据科学家团队是切切实实的业务部门,要进入到产品线里实现业务上的价值。

S:值得注意的是,Airbnb中负责数据基础架构的只有15个人,他们很好的支撑了200多人的数据科学家团队和10几条业务线,这归功于团队间的专业分工。

I:Airbnb在数据基础部门做了大量投入,下面重点介绍一下Airbnb数据基础架构部和数据科学家团队做的事情:

1、用户特征标签化

Airbnb基础平台用采用了Hadoop大数据处理的平台,把各个业务产品线上的数据收集。由于数据是现实世界的一种反应,要将这些偏于技术化的、零散的数据,转化为业务化的、集中的数据。比如房子、租客、地区、城市有什么样的特征,统统都要转化成标签,提供给数据科学团队使用。

数据基础架构部门

在这个系统里,他们特别强调了两类标签:一类公用标签,一类是定制化标签。(数据科学家根据自己对业务的理解去定制一些特征,这些数据进行长期应用后,又会转化到公用的业务里来)有了这些特征之后,数据基础架构提供一整套机器学习算法进行建模。

百分点同样做了很多标签技术的探索,尤其在异构数据方面,整合企业线上、线下、手机、PC、会员、访客等全渠道来源用户数据,形成体系化、可视化、可操作的用户数据管理平台;更擅长多种类标签生产,运用计算能力,将企业一方数据生产成统计类、算法类等标签,同时也能接入文本类、模型类标签。最终可形成360度用户画像,方便目标用户群圈定。

2、实验系统

Airbnb还有一个很重要的系统——实验系统。任何一个互联网的产品在做一些改进、投放的时候,并不知道会有什么效果,所以需要做一些实验。

数据科学及团队职责

数据基础架构部门要在这个实验平台上,方便数据科学家团队们调整自己的算法,来判断是不是真的对业务起到了帮助的作用。

数据基础架构部门只有15个人,也正是因为更多关注Airbnb自己的数据,所以才可以集中精力搞定这些事;数据科学家生成一个模型之后,就会在业务线里反复实验,之后出报告并提供产品改进建议。

Airbnb值得学习的地方还在于,其业务的深度和广度,让它更早地接触到很多公司都将面对的问题。我们也可以通过Airbnb八年发展中的一些小故事得到借鉴。

互联网时代用户体验为王,但如何做好却不容易。

为此,Airbnb在2013年做了一次非常大的改版,想把房子照片显示更好并在地图上显示出位置信息。

Airbnb上线新的页面后,对比研究了改进前、后的客户感受,发现升级完租房的比例居然下降了2%。数据科学家进一步分析,是因为系统里在某一些用户体验、操作步骤上出现了Bug,在IE特定的版本上会出现比较大的问题,在IE上下降了3%。

这个经验在后续的版本升级中得到延续,使得收入得到比较大的提升。

由于Airbnb的业务涉及到190多个国家,每个国家里有自己不同的货币,也有不同的支付手段。

比如说在中国,可能是愿意通过刷信用卡,也有可能通过支付宝去支付。但是在美国,支付习惯却是另外一种。这样一来,对于Airbnb来说,全球有645种支付方式,是一个很庞大的网络,被称为“现金路由”(Currency Routes)。房主能用自己想要的支付的方式,把钱给取出来,这是一个很大的支付上的体验问题。

因此,整个数据科学家团队建立了一个模型,用来监测某一个路由是否会出现异常,如果出现异常之后,就要转换到其他的路由区,即通知整个支付平台切到另外一个渠道,把漏洞给补上。

要实现数据价值,拼的是机构能力

我们认为,数据决策力是一种新的综合能力,运用数据一定要形成机构的能力,即Capability。

Airbnb所有的业务决策、产品设计和定价等等,都是挖掘出数据资产的价值,而不只是出具数据报告。由于195个国家中1700多万的租客都有自己的洞察,因此Airbnb要整合最核心的数据要素,构建模型并反应到业务里。这就需要将以上几种能力综合起来,形成一种机构能力。

进一步说,有了数据、模型,还要让系统智能地去做决策,而不是依赖人去做。这就需要去构建智能的业务系统,让这些系统能运用这些数据去做验证、分析,这也是我们搭建大数据平台的业务目标。百分点很早就开始应用智能数据洞察系统BDI,进行智能营销,从而解放人力。

总而言之,透过Airbnb可以提炼出两点:专门的数据基础部门将所有的数据集中在一起,能够通盘地去考虑数据标准化的问题,以及如何去提供服务的问题;之后,“嵌入式”的数据应用部门,在具体的业务里让这些数据可以实现自己的价值。

这也是企业建设组织架构可以借鉴的原则。现在很多企业面临的组织架构存在不合理的地方,是因为没有根据自己的特点,因地制宜地打通数据价值链条,实现机构能力。

形成一个不断循环迭代的闭环,数据的价值才会充分地释放出来。


来源:百分点

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

旅游交通大数据——大众旅游时代的“富矿”
旅游交通大数据——大众旅游时代的“富矿”
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
张涵诚:大数据招商平台可推动地方供给侧改革
张涵诚:大数据招商平台可推动地方供给侧改革

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部