量子纠缠:从量子物质态到深度学习
副标题[/!--empirenews.page--]
1引言 经典物理学的主角是物质和能量。20 世纪初,爱因斯坦写下E =mc2 ,将质量和能量统一在了一起。而从那之后,一个新角色——信息(Information)——逐渐走向了物理学舞台的中央。信息是关于不确定程度的度量。Shannon 创立信息论的初衷是为了定量化地描述信息的存储和传输。Jaynes 从信息论的角度研究多粒子体系,重新阐释了统计力学。原来,物理学家所熟知的热力学熵与Shannon 用来衡量信息量的信息熵(Information Entropy)系出同源。Landauer 指出擦除信息会增加热力学熵,从而产生热量。因此,对于信息的一切处理(比如计算)都受到热力学基本定律的约束。这些工作使人们逐渐意识到,信息不是一个单纯的数学概念,而是与物质和能量一样基本的物理概念。 量子力学给物理世界带来了固有的不确定性,从而促生了量子信息理论。量子信息论中最核心的概念是量子纠缠。如果两个微观粒子的整体波函数不能够被写成各部分的直积,那么它们之间就存在纠缠。对于存在量子纠缠的体系,观察其中的一部分能够告诉我们关于另外一部分的信息。类比于经典信息熵, 我们使用纠缠熵(Entanglement Entropy)来度量量子纠缠的大小。量子信息论的视角,特别是量子纠缠的概念在现代物理学的研究中扮演着日趋重要的角色。 凝聚态物理学家用量子纠缠来刻画量子物质态。传统上,他们使用对称性和宏观序参量来区分不同的物质状态。这成功地解释了超流体、超导体、磁性等丰富多彩的自然现象。然而,近些年来人们发现了越来越多仅用对称性难以区分的物质态,比如不同种类的自旋液体态、分数量子霍尔态等等。量子纠缠可以给这些新的物质态一个恰当的标记。比如,纠缠熵随着体系尺寸的标度行为反映了量子物质态的基本特性。而对于标度行为的修正也可能包含着关于物质态的普适信息。研究量子物质态中纠缠的大小和模式成为现代凝聚态物理的一个核心问题。此外,量子纠缠还指引计算物理学家发展高效的数值算法精确地模拟量子多体现象。本次专题的另外几篇文章介绍了使用张量网络态(Tensor Network State)方法研究量子多体问题的进展。张量网络算法的成功很大程度上来源于量子物质态典型的纠缠结构:面积定律。很多人们关心的量子体系的两部分之间的纠缠熵仅仅正比于其边界的大小,这使得利用经典计算机高效而精确地研究这些量子多体问题成为可能。有意思的是,量子态所遵循的面积定律还和黑洞的熵有着深刻的联系。从量子信息的视角审视引力、虫洞以及量子混沌等现象,甚至有可能加深我们关于时空的本源的理解。国际上关于这方面的研究开展得如火如荼。美国的Simons 基金会支持了一项专注于此的合作研究项目。 量子纠缠的深远影响并没有就此止步,一些最新的研究进展表明,它对机器学习(Machine Learning)中的一些问题也可能有启发和指导意义。机器学习的研究目标是让计算机获得一定程度的智能,不需要过多的人为干预就可以高效地解决实际问题。通常,这种看似神奇的能力是从大量样本的学习中获得的。由于近年来算法和硬件的快速发展以及大量的数据积累,机器学习取得了一系列令人振奋的成果。特别是2016 年3 月Google DeepMind 所制造的AlphaGo 程序战胜了世界围棋冠军李世乭,使得以深度学习(Deep Learning)为代表的新一代机器学习技术走进了大众的视野。如今,机器学习在图像和语音识别、机器翻译、计算广告、推荐系统等人类生活的方方面面都扮演着日趋重要的角色。而它的应用也在逐渐向天文、物理、化学、材料、生物、医药等众多科学研究领域渗透。具体到本文作者所工作的领域:将机器学习方法应用于量子多体问题,可以从高维空间纷杂的微观构型数据中提取出关键的物理信息。而将机器学习的思想与传统计算途径相结合,为解决凝聚态和统计物理中的疑难问题提供了新思路。最近的一些尝试包括使用机器学习方法探测相变和分类物质相,探索使用人工神经网络作为量子体系的试探波函数等等。这些尝试让物理学家们有机会仔细审视机器学习领域的核心思想和技术。本文介绍的就是这一方向上新涌现出的一个研究思路:从量子纠缠的视角审视深度学习,从而反馈机器学习的发展。 2深度学习和量子多体物理中的函数近似 深度学习究竟在做什么?用最简短的话概括,就是函数近似(Function Approximation)。函数近似的目的是用高效经济的方式尽可能精确地描述复杂的函数映射。实际问题中的目标函数可能是图像识别应用中从微观像素到图片类别的映射,可能是AlphaGo 中围棋的局面到最终胜率的估计,也可能是Atari 视频游戏中的画面到最优控制策略的映射等等。读者也许已经看出来了,以上这几个函数恐怕都很难用一个简洁的方式表达。即使考虑一个极端简化的情形:怎样描述有N 个二进制自变量的多元函数?原则上,我们当然可以存储一个2N 行的表格来精确表达这样一个函数。这个表格的每一行对应了一种可能的输入和输出,函数的计算也就等价于查表。可是只要N 70 ,即使用上全世界所有的存储介质,我们也没有能力存下这张表格,更不要说对它进行高效的查找了。 机器学习中的连接主义学派(Connectionism)提倡使用人工神经网络(Artifical Neural Network)来解决这类函数近似问题。连接主义强调复杂的现象(比如智能)不来自于相对简单的组成单元,而来自于这些单元之间的连接。图1(a),(b)展示了两种常见的人工神经网络结构。图1(a)是前馈神经网络(Feedforward Neural Network)。图中的每一个蓝色圆圈代表一个人工神经元,它接受上一层结果作为输入,加权求和之后通过一个非线性的激活函数传递给下一层。可见,前馈神经网络是通过多层非线性函数的嵌套来表达复杂的多元函数的。而图1(b)显示了另外一种函数参数化方式:限制玻尔兹曼机(Restricted Boltzmann Machine)。从名字就可以看出,玻尔兹曼机和统计物理有着十分密切的关联。我们可以将它理解成一个统计力学系统,其中包含了两组相互作用的随机变量:显变量(红色)和隐变量(蓝色)。“玻尔兹曼机”的名字来源于这些随机变量的联合概率分布遵循统计物理中的玻尔兹曼分布。而“限制”这个词来源于图1(b)中所示的特殊网络结构:所有连接都仅在显层和隐层之间。和全连接的玻尔兹曼机相比,这样的结构可以极大地提高计算效率。而对于一个只关心显变量的观察者来说,即便显层内部没有直接的相互作用,隐层神经元所诱导的有效相互作用还是可以将它们关联起来。 图1 几种参数化多元函数的方式(a)前馈神经网络;(b)限制玻尔兹曼机;(c)矩阵乘积态 (编辑:我爱故事小小网_铜陵站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |