܄

清华大学数据科学研究院院长俞士纶:异构让大数据将实现更多价值

【数据猿导读】 5月25日,清华大学数据科学研究院院长俞士纶在数博会上发表了《对异构数据源的思考》的演讲。俞士纶说,现在是大数据时代,一个重要的事情是我们要怎么融合不同的数据

清华大学数据科学研究院院长俞士纶:异构让大数据将实现更多价值

5月25日,美国伊利诺伊大学芝加哥分校特聘主任教授、清华大学数据科学研究院院长俞士纶在数博会“第一届大数据科学与工程国际会议——大数据科学认识与理解”论坛上发表《对异构数据源的思考》的演讲。他说,大数据时代,数据可以改变很多细节,我们要做的是找到有意义的数据,并融合不同的数据,将数据运用在实际的事情上。

俞士纶将数据库比作药品,将数据比作药品的内部结构。我们通过研究药的内部结构来预测这个药的治疗效果,但一个药的内部结构只是一些有限的资讯,而如果我们制作两个化学药品都有相同的效果,那可以把这两个内部结构的资讯合到一起将会得到更好的结果。这就像如果我们把来自不同的领域的数据库和数据联在一起,我们将可利用数据可以做出更好的预测。

俞士纶说,与这个比喻相似的是,豆瓣利用人们对于一个电影的喜爱程度,综合这部电影和这个人以往看过电影的主演、导演、电影类型、人物性格等多种电影资讯就可以进行预测,抓住人与人之间的联系,做出预测。但这种数据预测的效果又是因人而异的,有些人社交关系比较重要,但有些人却没有什么朋友,所以数据的预测要通过不同的路径,再进行预测,就会减少误差。

俞士纶说,当这种方法应用在治疗上,一个人进行老年痴呆症的检查时,医生不仅可以综合他扫描的CT,还可以对他做的抽血检查和以往病史等文字、图片及影像材料进行综合,将会得到更好的结果,这也是数据融合的例子。

俞士纶说,异构数据可能是一张图和与之相关一段图解,这是两个不同的方式来表达一件事。当我们从图和文字找到相似的地方时,我们通过图就可以找到相关的文字描述,通过文字描述,就可以找到相关的图片。如果将两者联系在一起,结果能更为准确。

俞士纶说,现在是大数据时代,一个重要的事情是我们要怎么融合不同的数据。比如气象预测,光做预测是是根本赚不了钱的,但如果应用在具体的货物运输、农业等具体领域,天气这些数据将可以改变很多细节,提供更多便利,成为真正有价值的数据。所以,我们首先要了解到什么是有意义的数据,然后如何把这些数据合在一起去提供更好的服务。


来源:数据观

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

旅游交通大数据——大众旅游时代的“富矿”
旅游交通大数据——大众旅游时代的“富矿”
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
张涵诚:大数据招商平台可推动地方供给侧改革
张涵诚:大数据招商平台可推动地方供给侧改革

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部