TalkingData:场景化重塑数据价值
谢军 | 2017-08-10 11:17
【数据猿导读】 近日,天翼智能生态博览会于广州顺利落下帷幕。本届博览会以“智能创造未来”为主题,围绕五大生态圈,设立了智能连接、智慧家庭、天翼物联网、互联网金融、云和大数据等5大主题展区,全面展示了智能生态发展成果。

近日,天翼智能生态博览会于广州顺利落下帷幕。本届博览会以“智能创造未来”为主题,围绕五大生态圈,设立了智能连接、智慧家庭、天翼物联网、互联网金融、云和大数据等5大主题展区,全面展示了智能生态发展成果。
TalkingData数据合作总经理谢军作为受邀嘉宾前往活动现场,并在大数据分论坛与诸位嘉宾观众分享了题为《场景化重塑数据价值》的演讲。
谢军表示:全球各个行业的数据存储量每年都在以50%的速度暴增,根据IDC的数据显示:全球存储量仅在2011年已达到1.8ZB, 预计2020年将超过40ZB。ZB,十万亿亿字节,这相当于每个中国人每分钟发3条微博,一共写2.6976万年才能完成。
然而数据的爆炸式增长,并不等同于价值的水到渠成。在我们以往的合作中,我们经常能看到许多企业的数据不但没有成为产生二次价值的资产,还变成了花费了高额的服务器及带宽的成本项。DT时代,如何进行数据的价值挖掘,已经已经成为企业必须面对的课题。
事实上,数据本身没有价值,只有当数据转化为支撑决策的智慧,价值才得以体现。我们把数据价值化的过程抽象为四个阶段:数据-信息-知识-智慧。从海量的数据中进行分析洞察,将数据转化为可读易懂的信息,从信息中抽象出规律将其变为可依据可遵循的知识,最后通过知识辅助决策,解决实际问题。数据的进阶过程,始终需要一种能量贯穿始终,这就是场景化。
说到场景,我们很容易联想到戏剧与电影的语境,“场”表示时间,“景”表示空间,场景是时间中的空间,是一幕幕时空片段。著名心理学家勒温提出了一个抽象理论:一个人的行为取决于带有个性的这个人与他所处环境的相互作用。即B=F(P*E)。其中E-Environment就是我们所说的场景,它包括周边环境以及因此产生的心理环境。
让我们用从数据业务的角度解读这一公式:B-Behavior是企业所能撬动的每一次用户交互; P-Personality是带有个性化标签的用户个体; E-Environment则是构建出的业务场景标签及业务感受标签。而这里的F就是数据科学家根据业务需求及场景构建的算法;归纳来说就是在特定的场景中选择特定的用户群能够更高概率的促成特定的行为交互。整个定式诠释的正是场景化业务模型的生成法则,我们可以称之为场景化模型定式。
当我们把这一定式灵活的运用到数据业务中,你会发现数据的组织思路非常清晰。无论是复杂的数据工程还是具体到数据业务,都可以围绕着B、P、E灵活开展。
说到数据工程,首先来看一下TalkingData 的数据工程流程闭环,整个过程被分为四个阶段:获取、组织、分析、动作,四个阶段不是独立分割,而是环环相扣。比如当我们开始获取数据的时候,就要去考虑最终收获什么,对哪类业务起到促进作用。同样,当我们用场景化标签进行数据增强时,业务指标是拆分场景的方向盘。
从12年至今,TalkingData自身的数据工程支撑着每天2.5亿的移动端app活跃终端的数据更新及加工,同时数据平台还接入了许多第三方公司的数据能力,进行多源数据的场景化服务编织。我们帮众多企业搭建了属于他们自己的数据工程平台,完成了一方数据的价值重构,并为企业扩展三方数据的能力,帮企业梳理场景、设计算法、定义价值模型。
我们坚信:未来,能够更好的应用异构的、情境化的数据,能够拥有更智能的算法,能够驾驭智能数据的企业才更有市场竞争力。
聚焦到数据工程中的标签抽取,虽然数据杂乱无章,但抽取逻辑可以很清晰。我们依然套用刚才的场景化模型定式,标签实际上是找到可具体化的P、B、E。以人为中心,汇聚业务或场景的标签,再按业务或场景归集,能够形成一套精细化的行业(或业务)标签体系。
在场景化标签的构建过程中,P、B、E标签的快速重构是标签库能否灵活对接业务的关键,同时也是数据工程智能化的标志之一。标签重构最常用的方法是行为标签转移。通过业务经验、市场定位、综合印象等,可形成针对特定“场景”的行为或人的认知,当遇到这些场景时,我们不但可以给人打上场景标签,还可以给这类人打上一个关联的行为标签或角色标签。
通过场景连接起的“人”与“行为”间的关系,可将“行为”或“人”的标签快速复制。除此之外我们还可以根据在固定场景中行为发生的频次来构建新的场景,如职住地标签;通过算法模型进行行为预测或人群放大,从而把已知样本的B、E、P标签扩展到未知的目标样本上。
我们以上谈到的数据,是以人为本的场景域数据,这部分是数据价值的核心。整个ETL的过程,就是场景化组织的过程,在组织数据的过程,除了人本数据,我们还会遇到许多和人弱关联的数据,这部分数据也需要找到与场景的关联,并被保存,为将来的场景延伸与业务探索打好基础。
在实际业务运营中,通过场景化模型定式依然可以清晰梳理出执行逻辑。以数据营销业务为例,客户在确定B即业务目标时,会根据以往的业务经验说出一些典型场景比,如**位置、**时间、**媒介等。而数据分析师需要根据目标B进行场景预测,或者说场景初始化,找出各类场景标签E及对应的人的标签P,保证算法有足够的变量,最终计算出高概率人群。
场景预测的过程是抽丝剥茧,数据分析师需要列出跟目标B有关联性的一系列小B动作, 然后再推演出相应的场景E与由用户P,最后通过算法计算出可实现目标B的最高概率人群P. 把用户群P推进业务场进行验证,得到实际的转化用户,一个数据驱动的闭环就基本完成。
多数情况下,初始的算法未必会让客户满意,这时候就需要用机器代替人脑放大智慧,也就是我们今天常说的人工智能。通过机器学习对转化用户的行为、场景及人口属性参数进行归纳与优化,动态调整参数与权重,优化算法路径,生成最有效的业务模型。
除了人本数据的情景化运营,事实上我们身边许多数据换一种解读模式,通过与设备或人建立关系,也可以发挥它的价值。比如气象、旅游、物联网等等。
今年TalkingData与康师傅联合打造“做有温度的零售店”,围绕消费者洞察和购物历程,开展了人(客户洞察、客户情绪画像)、货(IOT技术、产品洞察)、场(内场数据、外场数据)三者之间互动关系分析,打造了快消品企业首个运营4P模型(客户、产品、场景和定价的有机联动)帮助零售店理解“我的到店顾客是谁 ”、感知“店内顾客和商品温度如何 ”,探求零售背后的营销真相。
数据的价值挖掘,场景是关键,而场景从那里来,除了数据分析师大开脑洞外,我们更需要结合行业伙伴的能力一起探索。TalkingData始终怀揣开放的心态,无论技术还是知识我们都愿意与合作伙伴共享。今年我们推出了与GoogleAwareness API无缝兼容的智能设备情境感知框架Myna,并且将此作为开源产品发布。
Myna可以调用设备的数据和传感器来检测用户所处的状态与情景,包括时间、位置(经纬度)、地点、活动、beacons信标、耳机(插入/拔出)和天气等。我们希望最大力度的推动数据的智能化能力,帮助更多的企业用数据做决策;我们也希望携同更多企业一同致力于通过数据改善人类自身及环境。
来源:数据观-企业
刷新相关文章
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14