܄

Datatist首席架构师&COO董飞:浅谈预测性营销的原理和实践

【数据猿导读】 大数据最大的价值不是事后分析,而是预测和推荐。数据整合改变了企业的营销方式,现在经验已经不是累积在人的身上,而是完全依赖消费者的行为数据去做推荐。未来,销售人员不再只是销售人员,而能以专业的数据预测,搭配人性的亲切互动推荐商品,升级成为顾问型销售

Datatist首席架构师&COO董飞:浅谈预测性营销的原理和实践

来源:数据猿 作者:董飞

导语:古有水泊梁山英雄108将叱咤江湖,今有“中国大数据技术先锋108将”高端人物访谈搅动风云。2017年,由DT学院、清华大数据产业联合会、山西省大数据产业协会联合举办,面向大数据产业的技术精英、专家学者以及大数据产业链领域公司CTO的“中国大数据技术先锋108将”高端人物访谈活动正式启动,围绕大数据技术的多个层面进行分享,旨在搭建大数据技术传播分享的高端平台,促进大数据技术的业内交流。

首期专访人物——中国顶尖数据科学家董飞

Datatist首席架构师&COO,毕业于南开大学,硕士杜克大学毕业。先后在创业公司酷迅、百度基础架构组和Amazon云计算部门,LinkedIn担任高级工程师,Coursera从事数据工程师,负责过垂直搜索,百度云计算平台研发和广告系统的架构。为多位企业客户解决营销难题,具备丰富实践经验。


访谈主题:大数据技术在预测性营销上的实践

访谈录

DT学院:请您谈谈什么是预测营销

董飞:说到预测营销,不得不先提个性化的用户画像。我们针对每一类数据实体,进一步分解可落地的数据维度,刻画他/她的每一个特征,在聚集起来形成人群画像。比如下面就是两种典型年轻消费人群。

预测营销中的元素具体包括:

用户固定特征:性别,年龄,地域,教育水平,生辰八字,职业,星座

用户兴趣特征:兴趣爱好,使用APP,网站,浏览/收藏/评论内容,品牌偏好,产品偏好

用户社会特征:生活习惯,婚恋,社交/信息渠道偏好,宗教信仰,家庭成分

用户消费特征:收入状况,购买力水平,商品种类,购买渠道喜好,购买频次

用户动态特征:当下时间,需求,正在前往的地方,周边的商户,周围人群,新闻事件

当我们采集和分析这些用户画像,可以实现精准的预测营销。这是最直接和最有价值的应用,广告主可以通过用户标签来发布广告给所要触达的用户,这里面又可以通过上图提到的搜索广告,展示社交广告,移动广告等多渠道的营销策略,营销分析,营销优化以及后端CRM/供应链系统打通的一站式营销优化,全么提升ROI。

我们再说一说营销时代的变迁,传统的企业大多还停留在“营销1.0”时代,消费者需要什么,企业提供什么,而进入“营销2.0”,以社会价值与品牌为使命,也不能完全精准对接个性化需求。进入营销3.0的数据时代,我们要对每个消费者进行个性化匹配,一对一营销,甚至精确算清楚成交转化率,提高投资回报比。

大数据下的营销颠覆经典的营销4P理论,Product,Price,Place,Promotion,取而代之的是新的4P,People,Performance,Process,Prediction。在大数据时代,线下地理的竞争边界早就不存在,比的是早一步的先知能力,利用大数据,从顾客真实交易数据中,计算下一次的购买时间。营销3.0时代关键词就是“预测”。

预测营销能够让你专注于一小群客户,而这群客户却能代表特定产品的大多数潜在买家。以上图为例,你可以将营销活动的目标受众锁定为20万潜在客户或现有客户,其中包括特定产品的大多数买家(4万人)。你还可以拨出部分预算用于吸引更小的客户群(比如20%的客户),而不是整个客户群,进而优化你的支出。

过去我们看数据可能是被动的方式,但预测营销强调是决策价值,比如购买时间,你该看的不是她最后的购买日期,而是下次购买的时间,看未来的存活概率,最后生成客户终身价值(CLV)。预测营销催生了一种新的数据驱动营销方式,就是以客户为中心,核心在于帮助公司完成从以产品或渠道为中心到以客户为中心的转变。


DT学院:在现代商业中大数据的价值体现在哪?

董飞:大数据最大的价值不是事后分析,而是预测和推荐。我就拿电商举例,"精准推荐"成为大数据改变零售业的核心功能。譬如服装网站Stitchfix例子,在个性化推荐机制方面,大多数服装订购网站采用的都是用户提交身形、风格数据+编辑人工推荐的模式,StitchFix不一样的地方在于它还结合了机器算法推荐。这些顾客提供的身材比例,主观数据,加上销售记录的交叉核对,挖掘每个人专属的服装推荐模型。这种一对一营销是最好的服务。

数据整合改变了企业的营销方式,现在经验已经不是累积在人的身上,而是完全依赖消费者的行为数据去做推荐。未来,销售人员不再只是销售人员,而能以专业的数据预测,搭配人性的亲切互动推荐商品,升级成为顾问型销售。

DT学院:能举个例子说明精准营销的好处么?

董飞:“颠覆营销”书中提到一个例子,可以引述一下,大家思考一个问题:如果你打算搜集200份有效问卷,依照以往的经验,你需要发多少份问卷,才能达到这个目标?预计用多少预算和时间来执行?

以往的方法是这样的:评估网络问卷大约是5%的回收率,想要保证收到200份的问卷,就必须有20倍的发送量,也就是发出4000份问卷,一个月内如果可以回收,就是不错的表现。

但现在不一样了,在执行大数据分析的3小时内,就可以轻松完成以下的目标:

1.精准挑选出1%的VIP顾客

2.发送390份问卷,全部回收

3.问卷寄出3小时内回收35%的问卷

4.5天内就回收了超过目标数86%的问卷数

5.所需时间和预算都在以往的10%以下

这是怎么做到在问卷发送后的3个小时就回收35%?那是因为数据做到了发送时间的"一对一定制化",利用数据得出,A先生最可能在什么时间打开邮件就在那个时间点发送问卷。举例来说,有基人在上班路上会打开邮件,但如果是开车族,并没有时间填写答案,而搭乘公共交通工具的人,上班路上的时间会玩手机,填写答案的概率就高,这些都是数据细分受众的好处。


DT学院:如何生成用户的精准画像

董飞:大致分成三步:1.采集和清理数据:用已知预测未知;2.用户分群:分门别类贴标签;3.制定策略:优化再调整。

§采集和清理数据:用已知预测未知

首先得掌握繁杂的数据源。包括用户数据、各式活动数据、电子邮件订阅数、线上或线下数据库及客户服务信息等。这个是累积数据库;这里面最基础的就是如何收集网站/APP用户行为数据。比如当你登陆某网站,其Cookie就一直驻留在浏览器中,当用户触及的动作,点击的位置,按钮,点赞,评论,粉丝,还有访问的路径,可以识别并记录他/她的所有浏览行为,然后持续分析浏览过的关键词和页面,分析出他的短期需求和长期兴趣。还可以通过分析朋友圈,获得非常清晰获得对方的工作,爱好,教育等方面,这比个人填写的表单,还要更全面和真实。

我们用已知的数据寻找线索,不断挖掘素材,不但可以巩固老会员,也可以分析出未知的顾客与需求,进一步开发市场。

§用户分群:分门别类贴标签

描述分析是最基本的分析统计方法,描述统计分为两大部分:数据描述和指标统计。数据描述:用来对数据进行基本情况的刻画,包括数据总数,范围,数据来源。指标统计:把分布,对比,预测指标进行建模。这里常常是Datamining的一些数学模型,像响应率分析模型,客户倾向性模型,这类分群使用Lift图,用打分的方法告诉你哪一类客户有较高的接触和转化的价值。

在分析阶段,数据会转换为影响指数,进而可以做"一对一"的精准营销。举个例子,一个80后客户喜欢在生鲜网站上早上10点下单买菜,晚上6点回家做饭,周末喜欢去附近吃日本料理,经过搜集与转换,就会产生一些标签,包括"80后""生鲜""做饭""日本料理"等等,贴在消费者身上。

§制定策略:优化再调整

有了用户画像之后,便能清楚了解需求,在实际操作上,能深度经营顾客关系,甚至找到扩散口碑的机会。例如上面例子中,若有生鲜的打折券,日本餐馆最新推荐,营销人员就会把适合产品的相关信息,精准推送这个消费者的手机中;针对不同产品发送推荐信息,同时也不断通过满意度调查,跟踪码确认等方式,掌握顾客各方面的行为与偏好。

除了顾客分群之外,营销人员也在不同时间阶段观察成长率和成功率,前后期对照,确认整体经营策略与方向是否正确;若效果不佳,又该用什么策略应对。反复试错并调整模型,做到循环优化。这个阶段的目的是提炼价值,再根据客户需求精准营销,最后追踪客户反馈的信息,完成闭环优化。

我们从数据整合导入开始,聚合数据,在进行数据的分析挖掘。数据分析和挖掘还是有一些区别。数据分析重点是观察数据,单纯的统计,看KPI的升降原因。而数据挖掘从细微和模型角度去研究数据,从学习集,训练集发现知识规则,除了一些比较商业化的软件SAS,WEKA功能强大的数据分析挖掘软件,这边还是更推荐使用R,Python,因为SAS,SPSS本身比较昂贵,也很难做页面和服务级别的API,而Python和R有丰富的库,可以类似WEKA的模块,无缝交互其他API和程序,这里还需要熟悉数据库,Hadoop等。

在算法部分,我们通过相似度衡量聚类算法,主要核心是数据简化,让它具备大规模数据的能力,这里做变换,降维,抽样。在分类这一块,我们使用了决策树,Boosting监督的分类学习方法,随机森林来解决回归和分类问题。

DT学院:请谈谈你们公司目前怎么做精准营销的,比如如何拉新和留存客户?

董飞我们公司(Datatist)是专注于用大数据机器学习技术自动支持企业的智能决策和商业优化。拥有外部营销和内部营销相结合的闭环一体化用户运营优化解决方案。

对于外部营销优化:通过机器学习内部客户的特征,结合word2vec,神经网络多种模型精准预测最可能转化的潜在外部客户。

对于内部营销优化:通过机器学习客户的行为特征,精准预测最可能活跃的客户,最可能购买的客户等。并且通过内部触达渠道刺激用户转化,A/Btest,效果跟踪和持续优化等一站式解决方案提高内部客户的转化率。

我们模型使用的算法包括神经网络,逻辑回归,随机森林和回归树,但这些对于营销人员意义不大,重要的是,可能性模型是通过学习历史行为来预测客户未来动作的。下面在使用模型之前,训练期和调试期使用历史数据的方法。

拉新和留存是很多客户最关心的,我们的做法是通过数据挖掘和机器学习的方式提升效率,并且两者是有关联,通过内部留存每一步的跟踪和转化,我们可以刻画用户的精准画像,对不同分类的客户做不同刺激,预测可能转化的用户,并将特征记录下来,对外部的拉新数据能够重用。

以最常使用的电子邮件推送为例,以往只能盲目发送,消费者没反应就再发一次。导入大数据分析后,可以很精准地掌握消费者的打开情况,消费者没有点开阅读一定有原因,一种策略是规划促销活动,再次发送给没点开的消费者,观察哪些消费者对促销内容有反应,不断回馈修正。还有一种策略是建立每个消费者的消费习惯周期,比如顾客A是每隔30天购买,顾客B每隔60天购买,那么通过建模,第30天是顾客A的最可能购买点,之后购买概率衰退,最好在30天前的那一周发送电子邮件提醒刺激。如果太早提醒还没发现,太晚又错过了。因此在适当的时机,营销才能事半功倍。

总之,客户的资源有限,如何将人、时间、金钱等资源得花在刀刃上?通过数据进行有效资源分配,可以降低营销预算,只要在关键购买点触动他们,就可以达到很好的效果。但是对于即将流失的顾客,就应该投入相对高的营销预算,产生资源最大化的效果。


DT学院:预测性营销的选择方案有哪些呢?这里的开发用到哪些技术和工具?

董飞:关于预测营销的技术能力,有几种选择方案:1.使用预测分析工作平台,然后以某种方法将模型输入活动管理工具;2.以分析为动力的预测性活动外包给市场服务提供商;3.评估并购买一个预测营销的解决方案,比如预测性营销云和多渠道的活动管理工具。如下是我工作中常用的技术工具:

但无论哪条路,都要确定三项基本能力:

1.连接不同来源的客户数据,包括线上,线下,为预测分析准备好数据。

2.分析客户提供的数据,使用系统和定制预测模型,做高级分析。

3.在正确时间,正确客户,正确的场景出发正确行为,可能做交叉销售,跨不同营销系统。

DT学院:营销领域有哪些预测模型?

董飞:预测客户购买可能性的行业标准是RFM模型(最近一次消费R,消费频率F,消费金额M),但模型应用有限,本质是一个试探性方案,没有统计和预测依据。“过去的成绩不能保证未来的表现”,RFM只关注过去,不去将客户当前行为和其他客户当前行为做对比。这样就无法在购买产品之前识别高价值客户。我们聚焦的预测模型,就是为了在最短时间内对客户价值产生最大影响。这里列举一些其他模型参考:

§参与倾向模型预测客户参与一个品牌的可能性,参与定义可以多元,比如参加一个活动,打开电子邮件,点击,访问某页面。可以通过模型来确定EDM的发送频率。并对趋势做预测,是增加还是减少活动。

§钱包模型就是为每个客户预测最大可能的支出,定义为单个客户购买产品的最大年度支出。然后看增长模型,如果当前的总目标市场比较小,但未来可能很大,就需要去发现这些市场。

§价格优化模型就是能够去最大限度提升销售,销量或利润的架构,通过价格优化模型为每个客户来定价,这里需要对你想要的产品开发不同的模型,或者开发通用,可预测的客户价格敏感度的模型,确定哪一块报价时对客户有最大的影响。

§关键字推荐模型关键字推荐模型可以基于一个客户网络行为和购买记录来预测对某个内容的喜爱程度,预测客户对什么热点,爆款感兴趣,营销者使用这种预测结果为特定客户决定内容营销主题。

§预测聚集模型预测聚集模型就是预测客户最终会归为哪一类。

DT学院:目前对于预测性营销技术,国际上有哪些技术创新和开发工具?目前的使用瓶颈和顾虑是什么?

董飞:预测营销技术以模型工具存在了很多年,比如一些统计分析软件SAS,SPSS,R,还有像Netflix,Amazon,Facebook,Ebay,电信领域Verizon,ATT这些大公司,都有数据科学家团队,他们都在开发基于预测性的广告和营销系统。但这些工具都有一些重要的缺点,在你使用预测分析平台之前,首先要把业务需求翻译成技术需求,这样数据科学家才能将其转化为模型和查询语句。

大多数市场营销人员还是这方面能力不足,没有工程师和商业分析师的支持的话,就要从头做重复劳动,选择适当模型,去解决商业问题。而数据科学家往往也局限在某个行业内,找到合适的人才非常难,也很难跨行业获得经验。

在使用大数据平台时,往往要求在以下方面:整合数据,准备数据,开发,测试,配置模型,IT设施和数据架构都需要持续配合,才能最后帮助运营者生成报告并准备活动的名单。比如笔者当时在LinkedIn的广告部门,我们的数据科学家建立了一套强大的分析算法去计算预估CTR,预估bidprice,预估受众,但一旦脱离了LinkedIn的网站,广告主也没办法重复分析和得到持续的预测评分,而每个公司重新搭建一套大数据平台也是费时费力。

另外在个人信息使用上要特别注意隐私问题,顾客心理会有一些心理差异,比如客户的电话,邮箱注册某品牌电商(Tiffany)后,收到一些竞争对手如香奈儿不停给你发送广告,你也许会很生气。根据消费者报告,有71%的人认为,他们担心电商在不经过她们同意就出售或分享信息,因为越来越多的营销者从使用第三方的信息记录转向使用第一方数据来进行营销。

还有个“最后一公里”问题,比如说“我们拿到了网站注册的大量信息,也通过模型预测出来最有可能购买的客户,但作为运营人员,我无法根据客户分享给我的偏好和日期去发布一个Campaign(促销)”,就是说预测模型的输出结果对于营销人员来说很难使用--无法将日常的邮件,广告,门店和客户互动等营销活动结合起来。这也是Datatist想解决的一个客户痛点,在二月份我们将发布一站式的营销云产品。

DT学院:机器学习技术在预测营销领域是如何应用,会有怎样的发展?

董飞:去年人工智能特别火,特别是深度学习在机器视觉,语言识别,游戏AI上的突飞猛进,以至于人们开始恐慌人工智能是不是已经可以接管人类工作,我个人是对新技术有着强烈的兴趣,也非常看好新科技,数据与现实的关联。


注:本文由 山西省大数据产业协会 投稿数据猿发布。

欢迎更多大数据企业、爱好者投稿数据猿,来稿请直接投递至:tougao@datayun.cn


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

旅游交通大数据——大众旅游时代的“富矿”
旅游交通大数据——大众旅游时代的“富矿”
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
张涵诚:大数据招商平台可推动地方供给侧改革
张涵诚:大数据招商平台可推动地方供给侧改革

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部