܄

香港科技大学杨强教授:人工智能在加速发展,但真正的爆发还在较远的未来

【数据猿导读】 杨强教授在接受记者采访时表示,人工智能的发展是一个循序渐进的过程,但真正的爆发还在离人类很远的未来。并且,他还强调,三年后的媒体将面临人人都是媒体的状况,人工智能在里面扮演了重要的角色

香港科技大学杨强教授:人工智能在加速发展,但真正的爆发还在较远的未来

11月14日,2016腾讯网媒体高峰论坛在北京举办。香港科技大学计算机系主任及大数据研究院院长、2015国际人工智能大会主席杨强教授接受腾讯科技专访时表示,人工智能的发展是一个循序渐进的过程,目前我们身边已经有了一些人工智能辅助的融入,但这个领域真正的爆发恐怕还在离我们比较远的未来。

杨强教授还表示,三年后的媒体将会面临人人都是媒体的状况,意味着更为严峻的信息爆炸,在这个过程中,人工智能将扮演桥梁的角色,让对的信息触达到对的读者。

另外,针对媒体未来的发展,杨强教授还应当如何应对科技发展过程中,信息传播领域可能面临的信息茧房、隐私等问题,与腾讯科技进行了探讨。

香港科技大学教授 杨强

以下是腾讯科技专访摘编:

腾讯科技:您今天在演讲中提到了人工智能在媒体中应用的一些方向,您认为我们可以首先在哪一个方向上看到突破?

杨强:方向有很多。比如说像现在我们看到自媒体领域很繁荣,那读者可能就会有些目不暇接——信息太多了,我们每个人都在经历信息爆炸。人工智能可以做的一件事,就是在其中起到一个桥梁的作用,帮助把正确的新闻分发到用户手里。比如说使用机器学习来学会用户的喜好,然后根据文章的内容和读者群给用户推送合适的内容。我觉得这是可以做的第一件事。

这种分发和电商推荐有很多相似的地方,但也会有很多不同。比如说同一个用户,他可能在一天中不同的时间段,就想看不同的新闻。这是根据场景和时间,以及很多其他不同的因素来决定的。比方说我今天如果心情不好,那我想看的新闻可能就和我心情好的时候完全不一样。所以心情、天气,甚至是堵车这样的一些信息,都可能产生影响,那我们就将这些信息结合起来,来分析用户的喜好。

腾讯科技:这样的深度学习算法和现在我们所使用的基于兴趣标签的推荐有什么样的不同呢?

杨强:信息标签其实是必不可少的,但单纯的信息标签需要人工进行操作,是非常慢的,能给的信息并不多。正确的方法应该是以人工输出的信息作为老师来训练这些数据。然后训练出来一个机器学习的模型,接着让这个机器学习的模型来自行扩展,去学习、寻找建立信息标签的正确方法。这样我们就可以更快地标注更多的数据,并通过这些标记,把合适的内容,更准确的送到用户手里。

腾讯科技:机器所获得的数据都是基于用户已完成的行为产生的数据,那这样子会不会导致信息茧房的问题呢?算法基于我们已经读过的东西,我们以前感兴趣的内容进行推荐,会不会导致我们固步自封的兴趣当中,只能接触到自己感兴趣的内容?

杨强:这是有可能的,所以这就需要机器学习算法足够聪明。比如说我们可以利用一个强化学习的算法。这个算法它有两个好处。一个是他能够建立用户行为的一个变化模型,用户的兴趣,就可以随着时间迁移。一个读者他可能昨天喜欢的是美国大选,但今天就已经不那么喜欢看了——今天他可能更关心的是天气的信息。那么如何能让系统感知到这样的一个变化模型,我们就可以用一个新的机器学习算法来做。

第二种是我过去没有读过这种新闻,有些信息我可能并不知道,这就涉及广度的方面。所以系统需要留一定的空间来做测试,不断探测用户到底有没有这种兴趣?这种测试就可能会带来一些惊喜。

腾讯科技:我们在拓宽信息边界的过程中,可能涉及到从不同的平台来获得数据的问题,包括您刚才在演讲中提到的像传感器新闻这样的概念。这就涉及到一个隐私的问题了。

杨强:对,隐私的问题是一个大家都关心的问题。但隐私的问题除了过去那些信息安全的方法之外,还有两个办法可以解决。第一个办法是说你要给用户带来足够的价值,这个价值量已经高于了用户所损失的隐私的价值了。也就是说,人工智能给你带来这些便利是你特别想要的,那可能失去的这一部分隐私你就已经认为不重要了。比方说股票投资,我们可能需要把过去投资的信息告诉计算机,计算机才能告诉我更准确的预估。这些预估对我来说特别特别重要,那我可能就不那么在意我失去的投资纪录这样的隐私了。

第二个是我们可以有一些机制,把用户的隐私隐藏在系统里面,不给人看,也不用暴露出来。系统就用一种内涵的形式,一种隐藏的形式来表达用户的隐私,使用用户的隐私,而用完以后就阅后即焚,那你就不需要担心这个问题。这样一来,他可以使一个系统变得更加个性化,但不必暴露你的隐私。

腾讯科技:像这一类关于道德的问题,是大家在机器学习、人工智能的领域,非常关心的一些问题。之前的一些对话机器人,其实也出现了不少问题。比如说微软的Tay发布到推特上之后,就产生了一些非常负面的情况。您怎么看这个问题,以及我们可以用什么样的方式来解决这些问题?

杨强:对,这个情况就是“数据有偏”。英文中有一句话叫做垃圾进,垃圾出。数据如果本身就是有偏差的,结果也就不太可能正确。像在我们学习中,如果老师是一个坏人,那么学生教出来可能也是一个坏人。当然我们可以有一种审核机制:像这样子一个对话的系统,我们可以规定他的老师一定是我们认可的——它的来源,一定要是我们认可的。这样就可以形成一种认证的机制,让我们可以通过对来源地认证,保证他这个系统的公正性。

腾讯科技:随之而来又产生了一个新的问题——这个认证机制应该由谁来认定呢?

杨强:这样的一个认证机制,其实应该是由大众来认定的,就是大众来决定什么样的东西才是好的。比如说像现在的共享经济,就是把所有信息都公开给大众,让大家可以看清所有资源的去向,作出判断。信息来源的可信度,也可以像这样子来进行公示,让大家来看到这些新闻都是哪些人在看,这些新闻的源头是哪里?那我就可以来选择这些东西,我是不是真的可以相信?比方说在美国超市里就有很多小报,大家都知道上面的东西大多都不是真的,所以就不会认真对待这些内容。可是有些人他就是爱看这样的东西,他可能就是想娱乐自己,所以到今天这些小报依旧存在,但它的来源是非常明确的。那么,当我们看到一些大的报纸,我就会觉得它的可信度更高。这就相当于是无形中给这些报道的来源,做了一个标注,打了一个tag。我们就可以做类似的事情,比如说阅读这些内容的用户是谁,也可以作为一个tag报给我们的读者。

腾讯科技:那作为内容供应者的媒体人在智能化的趋势下,又会面对什么挑战呢?

杨强:媒体人的工作肯定是会变的,但是不会丢的。比方说之前我们可能会有一些特别繁琐的重复性的工作,也许以后就可以用机器来代替,这样人就可以从繁琐的工作中解放出来,可以专注在审核以及创造性的工作上。未来人作为主导者,将会指挥机器人,教育机器人。那大量的机器人就可以用来延伸个人编辑的能力,而让他不必去做一些不必要的事,可以最大限度地发挥他的才能。

腾讯科技:您刚刚也提到了,在这样的一个过程中,我们需要很多跨界的技术人才。那传统媒体人和这些技术人才之间应该怎样协作呢?

杨强:其实最好的协作方式就是同一个人,他又可以写程序,又是一个媒体编辑。

腾讯科技:这个可能就比较困难了。

杨强:这个是比较困难,但能不能说我们找到一些有编辑和写作情怀的技术人才,同时又能找到一些有技术情怀的编辑人才呢?从这样的两群人当中,培养一些人出来,我觉得还是比较有希望的。

腾讯科技:您畅想一下,三年之后的媒体将会是什么样的形态呢?

杨强:我觉得三年之后人人都可以成为编辑,人人都可以读到所有其他人写的东西。但这就意味着,三年之后,我们会面临更严峻的信息爆炸,可能会在信息的海洋中迷失。所以一个很重要的工作,就是为每条信息,为每篇报道打上它应有的信息标签,挂上他所有的来源和读者群。再将这些数据,通过人工智能、人工助手的手段,帮助人们找到他真正想读的一些文章。

腾讯科技:那您觉得人工智能作为一个整体,在可预见的时期内还可能在哪些领域爆发呢?

杨强:应该说哪里有大数据,它就可能在哪里爆发。而且不仅仅是要有大数据,还要有高质量的数据。高质量的数据指的是有结果、有反馈的数据。我们可以将反馈标记在数据上,结合它本身的一些经济价值、商业价值,就形成了一个信息的闭环。能够实现这种闭环的领域包括金融、媒体,还有很多其他的服务领域。

腾讯科技:您觉得我们离您理想的人工智能还有多远呢?

杨强:人工智能的发展不会是说一步到位的,而应该是循序渐进的。今天我们的身边已经有一些基于人工智能的助手了,它们可能会逐渐进入我们的生活,我相信这个速度是在加速的。

另外,我觉得在虚拟信息服务方面,比如说社交网络、媒体,还有手机上的信息获取这些领域,可能会比别的方面快一点。硬件智能化的到来可能也会比较迅速。但是硬件产业如果想要建立起一个大数据的获取机制,可能还需要一段的时间。比如说,我们现在已经可以在路上看到无人汽车,但多数时候还是一个标准化、比较封闭的场景。另外,家居和医疗领域,也算是一些特定的场景,我们也可以得到符合要求的数据。但真正的爆发可能还在离我们比较远的地方。


来源:腾讯科技

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

相关精彩内容推荐

我要评论

精品栏目

[2016/10/10]

大数据24小时

More>

[2016/09/26-7]

大数据周周看

More>

[2016/09/01-30]

大数据投融资

More>

[2016/11/11-15]

大咖周语录

More>

[2016/11/07-14]

大数据周聘汇

More>

[2016/11/08-15]

每周一本书

More>

返回顶部