܄

月度用户量达1.5亿,除了机器学习,Pinterest 还有什么金刚钻?

【数据猿导读】 目前,不少新兴公司都在通过内容的个性化和本地化来积累和维护用户,例如 Airbnb 和 Spotify。Pinterest 之所以出众,是由于用户自己带来了庞大的图像数据。在过去两年里,Pinterest 在更智能地利用所有的图像方面下功夫,现在看来他们的努力卓有成效...

月度用户量达1.5亿,除了机器学习,Pinterest 还有什么金刚钻?

Venturebeat 的 Jordan Novet 这样描述他使用 Pinterest 的体验:在 Pinterest上,我感觉就像刚和自己最亲密的朋友们参加了一场聚会一样,许多钉板都很有趣。这里有中世纪浅棕色的皮革沙发,有用黑褐色百叶窗装饰的房子,还有用铁质桌腿和木板条支撑的装有轮子的媒介控制台,当然还有肉桂卷。每一个推荐的背后都藏着它的原因,每个推荐都与我以前收藏在自己的 Pinterest 钉板上的东西和我以前看过或是搜索过的东西相关。之所以出现肉桂卷,是因为我关注的某个人收藏了它。

一切都不是巧合,Pinterest 的工程师多年来一直在改进其推荐系统,现在 Pinterest 每月活跃用户超过1.5亿,而且其中大多数用户都位于美国境外。所以为了继续保持 50% 的年增长率(去年每月有 1 亿活跃用户),Pinterest 采用了新的方法,包括有效利用人工智能、更快的排名系统和内容的本地化。

Pinterest 的数据科学工程师 Mohammad Shahangian 在旧金山总部的一次采访中表示:我们已在社会的关注下走向国际化,视觉信号将会变得非常有价值。

深度学习

机器学习在 Pinterest 的 Feed 流、搜索和相关图钉以及视觉搜索四个关键部分发挥作用。

视觉搜索系统依赖于称为深度学习的热门人工智能,在大量数据的基础上训练人工神经网络,然后通过神经网络来推断新数据。举例来讲,你想了解某个东西,可以很轻松地在 Pinterest 上找到相关的图片。苹果、Facebook、谷歌和微软等公司开始频繁使用这种方法,可以在节省计算能力的同时获取更多的数据。

Pinterest 在视觉搜索中使用这种技术的做法引人注目。用户可以通过点击每张图片右上角的放大镜来调整图像上叠加的矩形框的大小和位置。然后软件就可以找到与矩形中的的画面相似的东西。

Pinterest 也开始用深度学习来优化其应用程序的其他部分,例如锁定相关的图片。

对于刚刚固定在钉板的图片,Pinterest 可能已经对其有所了解,依据是其他收藏这张图片的人钉板上的内容。这就是所谓的 “co-occurrence”,是一个关于图片相关性的强大信号。不过,如果用户固定的图片以及搭配的文字比较罕见,第一次接触的话,Pinterest 可能无法识别,也就无法推荐相关图片了。这也是深度学习的规律,Pinterest 根据图片中的相似内容来给出定义。

即使在很多人的认知中,图像数据为王,然而深度学习并不是 Pinterest 推荐系统的主要驱动力。

Pinterest 的首席视觉搜索工程师 Dmitry Kislyuk 认为,内容中隐藏着巨大的机会,尤其是我们不了解的那部分内容。

排序系统

2015 年 5 月,Pinterest 推出了一个排序系统,根据对用户参与度的预测来更改图片顺序。

工程师 Stephanie Rogers 表示, 这项举措带来了 30% 以上的转发率。

今年 1 月份,Pinterest 做出了更深入的探索。该公司停止使用根据用户的行为对内容进行批量处理和排序的机器学习系统,这个排序过程可能需要一夜的时间来完成。新的实时排序只需要几秒钟,当用户选择了特定图片时,系统可以快速调整相关图片顺序。相关图片推荐是依据用户最近的搜索和保存等操作来给出的。

Rogers 表示,假如你正在查找一位明星,然后你找到了那个明星穿着特殊服装的图片,相关的图片推荐会出现那位明星,而不是那套衣服。把最近操作添加到推荐考量指标中,贴图保存数量提高了 4%。

本地化

Pinterest 在过去的一年里使用了几种策略,在国外获得广泛认同。Shahangian 表示,在新兴国家,一切才刚刚开始。所以深度学习和快速排序都很重要,因为人们首先看到的几样东西对之后的参与有着深远的影响。

一些员工发现,相比其他类型,摄影、美发和美容这类内容在许多国家获得不错的反响。而关于美国的婚礼的钉板在其他国家获得的关注度并不高。

Pinterest 还建立了只关注一个国家的某个类别特定部分的机器学习模型。随着某些类别的流行,Pinterest 在其中识别出早期的用户。Pinterest 还在某些国家找出那些多次发布受欢迎的钉板的 “tastemakers”。

另外,提供母语内容至关重要。

Rogers 说:通过各种技术,我们将本地展示份额从 8% 提高到 54% ,就是说人们看到超过一半的内容是由他们所选择的语言展示的。

用户似乎更喜欢本地化的内容,在一定程度上,本地化增加了用户的参与度。

接下来将发生什么

关于下一步怎么走,Pinterest 有几点想法。

一方面,就像他们对于相关推荐图片所做的改变,Pinterest 也可以改进视觉搜索结果的排序。

还可以将深度学习应用于自然语言的处理中,以生成特定类型的推荐。Kislyuk 表示,关于这点,Pinterest 的广告小组已经做过尝试。 

在优化视觉搜索方面,Pinterest 能做的还有很多。不过 Pinterest 可以好好谈谈他们识别给定图像中的对象的能力。

几周前,Rogers 在电视上看到一座清真寺,于是拍了一张照片。她把照片添加到 Pinterest,在进行视觉搜索之后,她找到了一张关于同一建筑物的图片,该图片的描述表明这是是位于伊朗的瓦洁尔清真寺,她表示这是一种很棒的体验。

Pinterest 统计数据

每月 2 亿次视觉搜索。

每月 1.5 亿活跃用户,同比增长 50% 。

750 亿个钉板。

每秒可为 2000 万个候选钉板排名。

每天推荐 100 亿个钉板,是去年的 2 倍。

每秒 3 万相关钉板的查询。

本地化钉板数量(根据国家和语言)增加 250% 。

75% 的注册用户来自美国境外。

40% 的注册用户是男性,年增长率为 70%。

30% 的参与度来自相关的钉板。

将 “Pin it” 改为 “Save” 之后, 美国以外的新用户增加了 20%。

更新归位馈送算法,参与度增加了 12%。

为每个用户启动个性化主题,每周活跃用户增加了 10% 。

在重新设计关于特定国家或地区主题的用户体验后,激活次数增加了10% -15%。

基于用户最近收藏或搜索的钉板排名,钉板收藏数量提高了 4% ,本地化相关的钉板数量增加了 5%。

在钉板中启动对象检测后,用户收藏钉板的可能性提高了 6 倍, 现在已经检测到数亿个对象。

为美国以外的用户提供的个性化钉板为原来数量 5 倍以上。

美国以外的用户在搜索和相关钉板中看到本地化内容的可能性相比去年提高了 3 倍。

修复之后,App 速度比之前快 3 倍。

进行视觉搜索的用户数量是去年的 2 倍。


来源:36kr

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

大数据投融资周报(4月5日——4月7日,共9起)
大数据投融资周报(4月5日——4月7日,共9起)
大数据周周看:今日头条近10亿美元融资入账,Adobe推出体验云平台Experience Cloud
大数据周周看:今日头条近10亿美元融资入账,Adobe推出体验云...
【独家首发】数之联完成A轮数千万元融资,大数据分析挖掘领跑者获资本青睐
【独家首发】数之联完成A轮数千万元融资,大数据分析挖掘领跑...

我要评论

精品栏目

[2016/10/10]

大数据24小时

More>

[2016/09/26-7]

大数据周周看

More>

[2016/09/01-30]

大数据投融资

More>

[2016/11/28-2]

大咖周语录

More>

[2016/11/29-6]

大数据周聘汇

More>

[2016/12/06-13]

每周一本书

More>

返回顶部