܄

阿里移动UC总经理陈超:UC如何利用大数据进行内容分发

【数据猿导读】 6月21日,2016(第十五届)中国互联网大会在北京召开,阿里移动事业群UC总经理陈超发表了“UC是如何利用大数据进行内容分发”的主题演讲。他表示,拥有大数据,就拥有了想象力,在此基础上对于数据的挖掘和理解非常重要

阿里移动UC总经理陈超:UC如何利用大数据进行内容分发

中国互联网大会是由中国互联网协会主办的中国互联网行业年度盛会,至今已成功举办十四届。中国互联网大会的主题设置和议题选定历来紧扣国家经济发展政策、围绕中国互联网行业趋势动向,是业内人士梳理中国互联网阶段性发展成果、共商互联网业发展前景的高端会议。中国互联网大会自2000年开办,作为互联网行业的顶级盛会,本届互联网大会设置七大板块,推出20余场特色论坛。

大会充分发挥自身桥梁作用和纽带功能,为政府官员、业界领袖、专家学者、中小企业主、草根创业者、媒体朋友以及关心中国互联网产业的广大网友搭建交流平台。本次大会以"繁荣网络经济 建设网络强国"为主题,聚焦"分享、融创、协同、生态"四个关键词,呈现经济发展的"新业态、新动能、新体验"。

以下是数据猿现场直播整理的“阿里移动UC总经理陈超”的演讲实录:

陈超:大家好,我是来自UC的陈超,今天我跟大家简单分享一下UC是如何利用大数据进行内容分发的。在整个DT时代,大数据是有非常大的想象空间,但这个想象空间其实是取决于你的数据资产的丰富度以及厚度,我们纵观整个移动互联网,发现好像只有BAT三家公司拥有非常庞大的数据资产。阿里巴巴数据资产非常立体、非常多样化、非常完整,拥有UC头条阅读的数据,包括微博社交数据,应用和游戏的数据,神马搜索、淘宝电商数据,包括高德地图、优酷视频数据,在BAT三家公司里,阿里巴巴整个数据非常完整,我们会发现对比百度来说,百度数据核心在于搜索数据,腾讯其实数据也非常完善,但似乎缺少电商的数据。整个数据资产是我们做大数据的基石,我们会更加去完善、充分挖掘大数据。拥有这么一个大数据,就拥有了想象力,在此基础上对于数据的挖掘和理解非常重要。

在业界对于数据的挖掘和理解有非常多的想法,我们拥有一个非常独特的优势是知识图谱,是由实体构成的,什么是实体?阿里巴巴是一个实体,美国队长是一个实体,以及一个明星、一个人物是一个实体。我们其实拥有几百万个实体,每个实体之间都有一个关系,关系链可以是数亿次,我们通过这么一个知识图谱去挖掘和扩展所有数据背后所隐藏的一些含义,而这些含义其实有助于我们更加去了解、去理解我们这个数据。整个数据是活的,只有通过这样的方式才能把它挖掘出来。

数据其实有地理位置属性,我们发现身边的人越来越关注城市发生了什么事情,周边发生了什么事情,不同地域、不同区域的人因为文化水平以及消费意识形态的变化,关注点也是不太一样的。我们正在做一件事情,即将所有的内容打上POI标签,有个概念叫做汇集成内容地图的概念,通过这个地图可以知道某一个城市、某一个区域发生什么事情,影响力如何,热度如何,以及覆盖面如何,地图的场景是未来这个数据有非常庞大的挖掘空间。

内容时间属性非常强,纵观每一个事件都会有不同的阶段,而每一个人都会处于不同阶段,在不同阶段所处的关键点也不太一样。从细分领域角度来说,也有非常多的时间轴,从看车、买车到保养,从看房、买房到装修,不同阶段关注点不太一样,我们想做的事情让数据时间轴化,变成一个一个时间轴。我们拥有非常庞大的数据,因为我们拥有知识图谱,并且我们对数据的理解会更加深度。

前面讲的是我们对于数据的理解,因为我们理解数据,所以我们需要更加去理解人、理解用户,实现从信息到人。描绘人的方式也很简单,就是用户画像,到底什么是画像?其实很多方式方法当前都比较简单,就是内容喜好,如果只用内容的喜好来说,对于人的理解是过于肤浅。我们一个核心的关键词就是人群聚类,这是有各种维度,包含内容的喜好,包括阅读能力,比如你讨厌标题党,不太喜欢低俗的东西,喜欢深度的东西,包含一些用户喜欢去评论、去分享等等,这些维度错综交叉,形成人群聚类的概念。实际上纵观大数据推进的算法,第一代是基于协同,就是阅读了什么东西,你给我推荐这些东西,这些其实是非常简单粗暴的。到了后来的演进,会挖掘一个用户关键的兴趣点,而通过这个关键的兴趣点做一些关联,往后延伸、往前看,未来的推荐,是基于社群+场景的推荐。

社群。社群范畴可大可小,有不同描述的方式,通过多种维度把它们提炼出来。我们要做的是如何实现人群的聚类,把人投影到不同的社群当中,依据他们的喜好推送不同的内容。

场景。时间、空间以及状态,在不同场景下,用户的诉求有什么变化,应该推荐什么东西,这是场景。

社群+场景其实我们要思考的一个核心问题就是针对不同的社群,在不同的场景下,如何做每一次有效的推荐,如何更有效的阅读他喜欢的东西、想要的东西。这是我们对人的理解。

我们用非常庞大的数据资产,对数据理解,如何使用这些数据,如何理解我们的用户?这些都是需要我们能够驱动上一个竞争,驱动媒体端,能够给媒体产生更多的价值。

目前我们正在努力做的事情就是大数据挖掘潜在受众,作为媒体,应该知道用户的群体是哪些,有哪些潜在的群体,希望在未来通过可视化的方式展现出来。但是仅仅只有这一点我们认为是不够的,我们通过大数据方式帮助媒体挖掘出潜在群体,希望媒体能够更多参与到这个大数据建设之中来,你是什么样的群体,用我们的方式可以更好的把它描述出来,去获得你想要的用户有什么样的特征,最终形成一个闭环,而数据的建设会更加完善,无论是对于商业还是对于用户,还是对于媒体侧都有非常庞大的价值。这么一个思路时间周期非常长,致力于在这些点上走得更长、更远。


来源:新浪科技

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

相关精彩内容推荐

我要评论

精品栏目

[2016/10/10]

大数据24小时

More>

[2016/09/26-7]

大数据周周看

More>

[2016/09/01-30]

大数据投融资

More>

[2016/11/04-11]

大咖周语录

More>

[2016/10/31-7]

大数据周聘汇

More>

[2016/11/01-6]

每周一本书

More>