܄

R语言分析老九门到底谁是主角,陈伟霆or张艺兴?

【数据猿导读】 老九门,两大男主角都是颜值担当,网友对于陈伟霆、张艺兴谁是男主展开了激烈的讨论,这真的很难讨论出来啊,谁还没有个真爱粉。于是,作者的好奇心犯了,决定用R语言为大家分析出来,这两位男神到底谁才是老九门的主角

R语言分析老九门到底谁是主角,陈伟霆or张艺兴?

本人最近看了老九门,两大男主角都是颜值担当,我的朋友中有喜欢佛爷(陈伟霆),有的喜欢二爷(张艺兴)。从我的朋友中发现更多人倾向于张艺兴扮演的二爷,他们认为二爷(张艺兴)是男1号。但是从出场次数和演员表排名佛爷(陈伟霆)都在二爷(张艺兴)之前。我一直认为佛爷(陈伟霆)是主演,也让我对这二位谁是主角产生的好奇,于是决定用R语言进行文本统计一下,证明谁是男1,谁是男2。目前关于R文本挖掘的方法已经有很多了,这里再简单介绍一下。进而论述结果。代码如下:

#####首先,加载所需要的工具包

######注意rJava需要jdk环境

library(rJava)

library(Rwordseg)

library("RColorBrewer")

library("wordcloud")

##########接下来要自定义加载词,因为二月红并不是传统意义的词语,如果不单独加载会被分成二月,红。两个词。

##########加载方法有很多,本人选择最简单的加载单个词语方法insertWords,deleteWords为删除该词

####insertWords(“二月红”)

###deleteWords(“二月红”)

#接下来就是正常的统计词频,小说数据在附件

#####从统计结果,可以看出佛爷出现的次数的确大于二月红

##将统计结果在画出词云展现一下,目前词云的形状可视化多种多样,本人用最简单的方式进行展现

#画图

mycolors <- brewer.pal(8,"Dark2")

windowsFonts(myFont=windowsFont("华文彩云"))

wordcloud(myfile.freq$word,myfile.freq$freq,min.freq=3,random.order=FALSE,random.color=FALSE,colors=mycolors,family="myFont")

从可视化展现看出佛爷字体大小大于二月红。

因此,从原著来讲,佛爷为男1,二月红为男2。


来源:数据分析网

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

在VUCA时代, 数据分析起家的蓝灯数据如何利用云原生微应用将“颠覆式革新”进行到底?
在VUCA时代, 数据分析起家的蓝灯数据如何利用云原生微应用将...
【金猿产品展】Thinking Analytics:用户行为数据分析平台
【金猿产品展】Thinking Analytics:用户行为数据分析平台...
【金猿产品展】FineBI:新一代自助大数据分析的BI工具
【金猿产品展】FineBI:新一代自助大数据分析的BI工具

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部