܄

香港科技大学教授杨强:人工智能需要大数据,迁移学习能让人人都享受人工智能的红利

【数据猿导读】 如今,我们的云计算技术可以利用群体智能、群体智慧、手机、网络等聚集大量的数据。但到目前为止,人工智能领域取得的成就,仅仅是部分富人、拥有大数据的人在享受,对于大部分人来说,只能旁观。杨强表示,迁移学习让人人享受人工智能红利

香港科技大学教授杨强:人工智能需要大数据,迁移学习能让人人都享受人工智能的红利

摘要:我们都在为人工智能技术欢呼,但问题是,人人都能享受到人工智能的红利吗?人工智能需要大数据,但大多数的人并不拥有大数据,这导致真正拥有大数据资源的人能把所有的资源都聚集在自己身边,豪门更豪。对此,香港科技大学教授杨强在2016中国云计算大会上表示,我们可以发展技术,得到其他人的帮助,得到别人知识的迁移,使我们在短时间内通过小数据就能迅速成长。如果我们有能力把大数据的模型迁移到每一个人身上,人们就都能享受人工智能带来的红利。

我们都在为人工智能技术欢呼,但问题是,人人都能享受到人工智能的红利吗?人工智能需要大数据,但大多数的人并不拥有大数据,这导致真正拥有大数据资源的人能把所有的资源都聚集在自己身边,豪门更豪。

对此,香港科技大学教授杨强在2016中国云计算大会上表示,我们可以发展技术,得到其他人的帮助,得到别人知识的迁移,使我们在短时间内通过小数据就能迅速成长。如果我们有能力把大数据的模型迁移到每一个人身上,人们就都能享受人工智能带来的红利。

人工智能得到快速发展

人工智能经历了漫长的发展历程。人工智能的先驱阿兰•图林曾发问,机器可以思维吗?从50年代开始,前人做出各种假设,提出了很多关键性的问题。机器可以学习吗?机器可以规划吗?机器可以推理吗?

人们设想把老专家的一些思考、思维和知识迁移到计算机里,但后来发现这个过程非常艰难,因为把知识描述出来、表达出来、学习出来,并非易事。在尝试的过程中,人们做出了很多努力。

在1990年代,IBM 公司推出一款国际象棋程序“深蓝”,在当年的人机大战中,战胜了当时国际象棋世界冠军卡斯帕罗夫,这一消息在世界范围内广为流传,这是人工智能的一个里程碑。但云计算是人工智能的前提,因为当时并没有能帮助人们收集大量数据的云计算,导致了数据量的不足。

如今,我们的云计算技术可以利用群体智能、群体智慧、手机、网络等聚集大量的数据。今天的人工智能活跃起来,有以下几个原因:

1、汇聚了大量的数据。无论是谷歌公司,还是国内的互联网公司,都汇聚了很多大数据。

2、今天的计算能力突飞猛进。

3、深度学习、强化学习等算法取得了很大的成就。人们可以用机器来做同声翻译,可以做非常好的人脸识别,基于图像的搜索变得非常便利。作为一个辨别性的模型,深度学习模型可以转化成一个生成模型。图片识别性转化成生成器可向深度学习描绘那些印象最深的情景,科学家可以面对图片用文字问自然语言的问题,在图片里得到答案,得到文字形式的回答。阿尔法狗很牛,是因为其积累了大量的棋谱,可以产生3千万的盘面来训练。

资源不均导致的人工智能隐忧

从互联网到人工智能的转变,成功还是集中在大公司。到目前为止,人工智能领域取得的成就,仅仅是部分富人、拥有大数据的人在享受,对于大部分人来说,只能旁观。没有大数据资源的人,是否就不能享受人工智能的红利呢?

在生物信息领域,可以获得单条的基因链或蛋白质链大量的数据,但是把它和人的行为对应起来的数据却少之又少,能得到几千条样本已是相当不错,这和图像识别里上千万个样本的数量简直不能相提并论。所以,深度学习至今为止对于生物信息领域的大部分数据还是无法使用。教育领域积累的大量数据也无法被大部分企业享用。

18世纪的工业大革命中,资本使得某些资本家变得越来越强大,使得穷人越来越穷,富人越来越富,今天的智能革命也有这样的危险。数据是资本、是石油,有数据的人能够提供越来越多的服务,也就能够得到更多的数据。这会不会形成一些智能寡头?这才是对人类最大的危险,而并不是人工智能本身。

人工智能可以将我们的能力扩大,我们希望所有人都能享受人工智能带来的红利,该怎么做?

迁移学习让人人享受人工智能红利

杨强表示,他们在这方面做了很多努力,其中一个努力是迁移学习。如果能在计算机上做到迁移,就可以在数据量少的情况下得到效率的提高。例如,当我们来到一个新的领域时,如果有能力把过去的模型迁移到新的领域,那么在新的领域就不需要过多数据。这样一来,小数据也可以享受人工智能的福利。

比如,在推荐领域有一个冷启动问题,即在一个新的领域没有足够的新数据。解决冷启动问题的方法就是把过去通过大数据建好的模型迁移到新领域,使得人们在新的领域只用少数的数据也可以把工作做好。

同时,可以让机器读取文字,变成对图像有用的知识,这样一来,知识就可以在不同的表达之间做迁移。研究发现,让机器读一千个字,就可以足够好地识别一幅图片,也就是说书并不需要无限的读下去。把迁移学习和强化学习相结合,使得我们不需要训练很长时间,就可以学会新的技能。

在贷款方面,贷款往往都是小额贷款,大额贷款的样本非常少,无法做对应的模型。杨强介绍,最近他们的团队通过迁移学习把小额贷款的大量数据产生的模型,迁移到大额贷款的少数样本上,取得了非常大的成功。这样,只有小数据的人也能够享受人工智能红利了。


来源:中国软件网

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

MIT训练出了一只变态、罪恶、极度阴暗的人工智能——诺曼
MIT训练出了一只变态、罪恶、极度阴暗的人工智能——诺曼
数据智能 无限未来—2020世界人工智能大会云端峰会数据智能主题论坛顺利举办
数据智能 无限未来—2020世界人工智能大会云端峰会数据智能主题...
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部