܄

量子物理推动机器学习

【数据猿导读】 2016 年3月,AlphaGo 在五番棋中赢了四盘,打败了世界上最好的棋手之一李世乭。AlphaGo 的成功被认为是人工智能研究的一个里程碑

量子物理推动机器学习

2016年3月,AlphaGo在五番棋中赢了四盘,打败了世界上最好的棋手之一李世乭。AlphaGo的成功被认为是人工智能研究的一个里程碑。在围棋中,通过蛮力搜索所有可能的策略从而找出最好的走法是行不通的;落子位置的组合数比宇宙中的原子还要多,而AlphaGo所使用的处理器的计算能力与今天的超级计算机相比还算是轻量级的。其成功的秘密在于和一个特殊的陪练,他自己,进行严格练习。为成为称职的陪练,AlphaGo的“深度神经网络”参考了包含大约三千万个专业走法的数据库。

机器学习被认为是人工智能侧重于数据的一面,涉及到把问题的海量实例输入到计算机,它利用数据的模式来解决以前从未出现过的情况。例如,喂给计算机许多同一个人的图片,再给它另一个新的图片问是否是同一个人。难点在于我们不知道如何将视神经的视觉刺激和在图片中认出一个人这件事联系起来,机器学习方法要给出一个一般的方法来找出数据中复杂的模式。

量子物理学能发挥什么作用?运行AlphaGo的计算机是基于经典物理的,通过操控0和1信号的微电子线路来处理信息。如果我们造一个基于量子理论的计算机会如何?这个设备会从根本上改变计算的极限吗?这很难回答。我们还无法建造一个能解决现实问题的量子计算机,已有强力的数学语言被发展出来用以刻画和研究“量子算法”。目前研究并不局限在学术界,一些大的IT公司比如谷歌和IBM也开始在这方面竞赛,寻找量子计算机“杀手锏”。于是,机器学习就登场了。

既然知道量子计算机的工作语言,我们可以开始思考量子计算将对机器学习的影响了。这被称为由量子增强的机器学习,它是量子机器学习的一部分。为了解量子增强的机器学习,我们首先要理解机器学习是怎么工作的。

机器学习

领悟机器学习概念的快捷方法是通过数据拟合。比如你做了一个实验生成了数据点(x,y),其中x是可控参数,y是测量结果。作为物理学家,你可能想得到一个可以解释这些测量结果的模型。换句话说,你想通过产生的数据,在一定误差下,找到关系y=f(x)。这可以通过把数据喂给计算机,然后利用数值软件找出依赖于参数的函数f(x)中拟合得最好的一个来做到(图1)。换句话说,这是个优化问题。

图1让模型尽量简单。在给定相同数据集的情况下,曲线拟合软件给出了两个不同的模型(蓝色和红色)。尽管模型1完美地拟合了数据,但是弯曲度更小的模型2有更好的泛化能力,于是对新数据有更好的预测

对机器学习来说,解决优化问题意味着工作完成了一半。无需实验,人们可通过模型来预测新的控制参数下的测量结果。人们对传统上认为需要人类经验的机器学习应用更感兴趣。例如,x表示宏观经济学变量,而y代表了下周油价的涨幅。如果我们从数据中推出了模型y=f(x),就可以用它去预测明天的油价。而输入是照片的像素,输出是关于Sivu是否在照片中的回答时,机器学习被用来做图像识别。这些应用中的共同点是用于回答有关复杂关系的问题,且答案很值钱。

听起来很直接,但机器学习处理的问题通常非常困难。比如,一个优化问题的地形像喜马拉雅山那么大,而你要靠双脚在没有地图的情况下找到最深的山谷(图2)。在图1数据拟合的例子中,如果我们定义最好的模型为,对所有数据点y来说,离它们最近的f(x),更弯曲的函数(蓝色)更好。但当我们引入一个新的数据点,更粗糙的拟合(红色)给出了更好的预测。对于登山者来说,弯曲程度更高的模型所对应的优化问题的地形不太有用。一个有用的优化地形的模型,可以从已有数据背后的模式中泛化出还没有出现的数据,这不要求在已有数据上拟合得比较完美。给出一个有效的优化模型需要直觉和实践经验,是利用机器学习能力的关键。

图2最优路径。数学上的优化问题就像一个登山者徒步在大山中寻找最深的山谷。机器学习通常需要求解复杂的优化问题,其中登山者不得不穿过非常多的山谷来找最深的那一个

量子推动(AQuantumBoost)

用量子计算增强机器学习的方法是把困难的优化问题交给量子计算机。算法“工具箱”已经被量子信息界发展起来了,而挑战是去组合、调整和扩展这些工具以至于对传统计算机实现压倒性优势。三个用量子计算机解优化问题的方法解释见本页下方方框内表述。

在把子任务交给量子计算时,有一点要特别注意。为了让这些方法能工作,需要把数据编码到量子系统中。一个方法是把黑白图像表示成有指向上下自旋的格点。用量子叠加允许我们将很多图片存在一个量子系统中。其他的编码策略更复杂,但全部都需要我们制备量子系统的初态来表示数据集的数值。对于机器学习量子算法来说,编码数据是一个至关重要的瓶颈和挑战。

向量子AlphaGo迈进

在下一代的AlphaGo能在量子硬件上运行之前,还有很长的路要走。首先,我们需要稳定的大尺度量子计算机去运行发展出来的软件。需要在经典数据和量子系统之间设计一个界面,使得把问题编码到设备中。还需要更好的量子工具来做优化。

最重要的是,我们需要学习经过数十年实践检验的机器学习中的技巧。要将问题表述为适合量子计算的形式,而不是仅仅将经典计算中的优化问题交给量子计算机。问题是:量子计算机可以解决什么类型的优化问题,对于这个问题的回答是否可以用来定义新的机器学习方法?是否存在一些特定的物理问题适合由量子增强的机器学习来处理?我们是否能用真正的“量子模型”来处理这些任务?我们在量子计算中的思考方式能否对传统的机器学习研究思路有所创新?

总结一下,量子增强的机器学习必须重新放在量子计算的研究框架中,成为一个真正的交叉学科课题。这需要沟通和“翻译”两个领域。两边所用的语言或许没有我们想的那么遥远:量子理论和机器学习都处理观测量的统计。无论如何,问这些问题可以让我们思考得更加深远。

(作者:郜勋 尹璋琦)


来源:中科院物理所

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

美国大数据行业究竟什么样? 我们带你一探究竟
美国大数据行业究竟什么样? 我们带你一探究竟
数之联CTO方育柯:大数据时代下的传统制造业
数之联CTO方育柯:大数据时代下的传统制造业
明略数据工业大数据专家葛利鹏:大数据驱动的工业人工智能初探
明略数据工业大数据专家葛利鹏:大数据驱动的工业人工智能初探

我要评论

精品栏目

[2017/04/11]

大数据24小时

More>

[2017/04/03-7]

大数据周周看

More>

[2017/04/03-7]

大数据投融资

More>

[2016/11/28-2]

大咖周语录

More>

[2017/04/03-10]

大数据周聘汇

More>

[2017/04/04-11]

每周一本书

More>

返回顶部