phymath999: 最小作用量原理与相位光程，折射率和光线实际长度的乘积,当折射率在空间不同区域有所不同时，不同区域内的光线也要相应乘上不同的折射率。当空间折射率连续变化时，光线就要分成无数无穷小的线段，分别乘以所在处折射率并求和。由于折射率和光速有关系c=nv，可以马上看出s=vt为光线在介质中走过的真实距离，而光程ns=nvt=ct，和时间成正比，即是说：光程最短实际上就是时间最短

Tuesday, December 11, 2012

最小作用量原理与相位光程，折射率和光线实际长度的乘积,当折射率在空间不同区域有所不同时，不同区域内的光线也要相应乘上不同的折射率。当空间折射率连续变化时，光线就要分成无数无穷小的线段，分别乘以所在处折射率并求和。由于折射率和光速有关系c=nv，可以马上看出s=vt为光线在介质中走过的真实距离，而光程ns=nvt=ct，和时间成正比，即是说：光程最短实际上就是时间最短

最小作用量原理与相位

注：为了方便不同层次读者，本文不强调积分概念，但严格说一些乘积（如vt，Lt）应该理解为积分。

1.牛顿力学

经典力学中的牛顿力学，以牛顿的三个实验定律为基础和中心，建立实际物理场景的数学模型之后，通过微积分等数学工具加以处理，以得到各种结论。

具体点说，我们首先通过牛顿第一定律建立了惯性的概念；其后，牛顿第二定律在引入m表征惯性的基础上定义了力F，并指出了F=ma的关系，形成了自洽的理论体系。牛顿第三定律补充说明了自然界中力的性质，当然我们后来发现，牛顿第三定律在很多情况下不适用，但因为牛一、牛二自成体系，即便是牛三不成立的问题中也可以用来解决问题。

对于要解决的问题，往往在实际中可以分为两类：条件与力有关，而问题与运动有关；或者条件与运动有关，问题则与力有关。前一种问题从牛顿力学的角度看是正问题，因为牛顿力学的基本精神就在于：力的条件决定运动情况。后一种问题则是反问题，是要用运动情况反推出作用的力。

正问题有如下例子：

1. 合外力为0。由于合外力为0，加速度为0，故而做运动中速度v保持不变，即匀速直线运动。

2. 质点在平衡位置附近，距离平衡位置x时，受力指向平衡位置，写为F=-kx。这种情况下，理论上可以证明物体运动x~t关系为三角函数关系x=Acos(wt+fi)，这种运动称为简谐振动，A称为振幅，w为圆频率，wt+fi称为相位。

3. 质点与某中心相距r，则作用力F=k/r^2，方向沿质点与中心连线。当k<0时，表示力指向中心，这时这种力最典型的有球对称电荷、质量分布产生的静电引力（库伦定律）或万有引力（万有引力定律）。这时根据质点能量不同，轨道划分为E<0椭圆（圆），E=0抛物线，E>0双曲线。k>0时，表示力背离中心，典型的有静电斥力，质点轨道只能是双曲线。

以上列出了三种常见的最简单的运动形式，实际上物理世界中有各种不同的运动，也都可以从牛顿第二定律列出的方程出发加以解决。另一方面，以上问题反过来问就成了反问题，反问题就有解是否唯一的疑问存在，即给定一种运动形式，是否只有一种力的形式？一般来说这个问题没有确定的答案。对于上面的三个问题，问题1显然有唯一的力形式，即合外力F=0。而牛顿在其名著《自然哲学的数学原理》中证明了问题三的力形式也是唯一的。那么问题2呢？留作读者思考。

上面我们回顾了牛顿力学的基本内容和方法，这套方法在拉普拉斯、泊松和欧拉、高斯等大数学家的努力下发扬光大，一度统御着人类对大自然理解的极限。

然而，在这些数学家发展牛顿力学的形式结构时，却一不小心，遇到了一个非常意外的发现。这最早要追溯到一位几乎和牛顿同时代的业余数学家——费马。费马这个人非常有趣，本身工作不是做数学或物理，而是一位法官。他在法律界内有着刚正不阿的美名，却只是把数学作为业余无事时的一个嗜好。但就是这样一个法律界人士，却成为了那个时代最伟大的数学家之一，当然也被称为业余数学家之王。我们知道，著名的费马大定理就是他提出的一个猜想，这个猜想直到20世纪90年代才被普林斯顿数学家怀尔斯以复杂的数学工具证明。但今天我们要说的不是费马大定理，而是他的另一个发现：最小光程原理，也就是费马原理。

2.费马原理

先让我们回顾下基本的光学知识，我们知道光在均匀介质中走直线，而在非均匀介质中可能走折线甚至曲线，这可以完全由折射定律（斯涅尔定律）决定。也就是说，光线本质上是走直线的，而之所以不走直线是因为外界的某些影响，而这些影响可以用折射与反射定律加以描述。具体来说，当光线射入一个介质区域时，我们可以从光的初始入射方向出发，随着光的直线运动，直到碰到折射率不同的分界面，发生满足折射定律的折射，或者碰到反射面则反射。这样我们可以跟随光线的运动，并预测光线方向的每一次转变。这种做法和牛顿力学对于力学中物体运动的描述有异曲同工之妙。

图2，光线的折射

我们还知道，两点之间线段最短。那么这两者会不会有什么深邃的联系呢？均匀介质中，光的实际路程确实走了最短那条，那非均匀介质中的光线，是不是也有某种最短的性质呢？如果是，这一定与折射率有关。沿着这条思路，费马发现了一个堪称科学史上极具革命性的结论：任意介质中，给定两端点的光线，其“光程”永远取最小值。而所谓光程，是一个新的概念，指折射率和光线实际长度的乘积。当折射率在空间不同区域有所不同时，不同区域内的光线也要相应乘上不同的折射率。当空间折射率连续变化时，光线就要分成无数无穷小的线段，分别乘以所在处折射率并求和。由于折射率和光速有关系c=nv，可以马上看出s=vt为光线在介质中走过的真实距离，而光程ns=nvt=ct，和时间成正比，即是说：光程最短实际上就是时间最短。

从这一原理出发，我们可以重新推出光的反射定律和折射定律。譬如对反射定律，直接把两端点的其中一点关于反射界面对称过去，然后就容易找到两点间最短的连线，即真实光线，容易看出满足反射定律。折射定律的导出留给读着思考。

图1，反射定律的导出

这个原理之所以说革命性，是因为他从根本上与基于折射定律和反射定律的几何光学走了相反的一条道路。在几何光学中，如果我们要研究光线的形状，就要从一个时刻出发，跟随光线运动并令光线在每个介质不均匀处依据折射定律或反射定律改变初始光线的方向，最终我们将得到一条符合实际的光线。但费马原理则反过来给出过两固定点的光线应该有什么宏观特征，再从这个特征出发，从各种不同可能的路径中筛选出真实光线的轨迹。这不仅仅是方法上的不同，更是观念的一次洗礼。

事实证明费马原理背后的意义远大于其在光学上的应用。一次，著名数学家约翰。伯努利提了一个非常有趣的问题，即在地球重力场下，给定初末两点（不在一条铅垂线上），问沿怎样的轨道下滑最快？初看似乎直线最快，但很容易发现先从较高点自由下落到较低点同样高度的平面，再不变速地转向（可以利用一段圆弧轨道）平行移动到较低点将跟省时。实际上容易构造出更加省时的方案，但是哪种方案最省时呢？伯努利把这个问题公布出来，以挑战当时在世的所有数学家，包括伟大的牛顿和他的哥哥雅克布。伯努利。据说当时已经是造币局局长的牛顿在看到这个问题后，一下就被吸引了过来，从傍晚开始一直算到凌晨两点终于解决。而雅克布。伯努利更是发展了一套完整的方法求解这条轨迹，为今后一个繁荣的数学分支：变分法奠定了基础。但是不管是谁，在看到约翰本人的解法后都自愧不如。约翰的解法以费马原理为基础，相当巧妙。他在空间中用折射率分布代替重力场，使得不同高度处有不同的折射率。由于折射率和光速的关系，则不同高度光线有着不同的速度，约翰让这些速度正好等于重力场中相应高度的质点具有的速度，就可以用用时最短的光线来确定用时最短的下滑路径了。这一方法完整的解决了这个难题，答案是滚轮线。

其实从一系列不同的轨迹中，寻找具有某种极大或极小性质的曲线，一直以来是数学家乐于思考的一个问题。古希腊数学家研究过怎样的闭合曲线，其围绕面积最大，发现是圆；费曼原理也需要求解给定初末端点，求解光程最短的曲线。随着伯努利问题的提出，现在这样的问题和物理学中的力学似乎又产生了千丝万缕的联系，就更让人遐想连篇。基于折射、反射定律的几何光学有着与牛顿力学类似的基本思想和处理问题的基本方略，那么有没有可能找到一个类似费马原理的普适原理，为物体的运动轨迹也找到某种量取最小的判断标准？随着微积分的发现，人们发现雅克布。伯努利解决上面那道难题的方法很容易推广到解决各类寻找极大、极小值曲线的难题。这套方法被数学家冠以变分法之名，开始广为流传。数学方法的发展和普及反过来影响着物理学发展的进程，这是亘古不移之理。18世纪，数学家开始用手头的工具打造这样一套基于变分法的物理学。

3.最小作用量原理

最小作用量原理，顾名思义，就是说给定运动的初末时间、位置，真实运动取作用量最小的曲线。最小作用量原理最早应该追溯到与费马、牛顿等人同时代的大学者莱布尼兹，后来由欧拉、莫陪督、拉格朗日等人发展完善。1744，数学家莫陪督首先提出了这一思想。他认为对于给定了运动能量E、初末位置和时刻后，物体在整个过程中的动能与时间的乘积的两倍（2Ek*t）取最小。动能与时间的乘积是一个看起来有些奇怪的量，但是似乎又表明了物体轨迹的某种整体性质，于是被莫陪督称为作用量,记为S。

上面莫陪督原理是在所有能量为E的轨迹中选取，更一般的做法是取所有不同的轨迹。，那就是：在给定初末时刻和初末位置后，拉格朗日量L和时间的乘积（作用量S=Lt）最小的路径为真实路径。其中拉格朗日量L=Ek-V，即动能和势能的差。容易看出，只取Ek+V=E的轨迹时，始终有V=E-Ek,于是L=2Ek-E，由于所有不同的轨迹有着一致的E，所以真实路径就是2Ek最小的路径。对于多粒子系统，则要用总动能减去总势能。譬如对刚体，就要用刚体平动动能加上转动动能再减去刚体系统总势能。

随后，拉格朗日从最小作用量原理出发、依靠变分法推导出了牛顿第二定律，并从牛顿第二定律反推出最小作用量原理，这就从数学上严格证明了最小作用量原理和牛顿力学的等价。

这样，宏大巍峨的牛顿力学大厦，就这样被归结到一个简单的原理，这不能不说是物理学史上神妙惊人的一笔。而同时很多目的论者也开始鼓吹：最小作用量原理体现了上帝意志云云。实际上从数学上来说，微分方程求解轨迹问题总是可以转化为从一系列轨迹中选取一条具有某种极大、极小性质的真实轨迹的变分问题。所以并不能说最小作用量原理的存在就一定体现了某种超自然力量或是自然界的根本性质。但最小作用量原理确实在物理学上发挥起了重要的作用，这无关神秘主义，而是其数学形式（某量取最小值）所带来的巨大便利。

随着数学家们的努力，建立在最小作用量原理上的分析力学渐渐完善了起来。拉格朗日首先通过最小作用量原理推导出了一般性的刚体和约束系统中，如何通过最小作用量原理导出和牛顿运动定律等价的方程组——拉格朗日方程组；后来，哈密顿通过变量替换，得到了另一个等价方程组——哈密顿方程组；而另一种更加抽象的、也是来自于变量替换思想的哈密顿-雅克比形式也建立了起来，其基本想法是从最小作用量原理出发，得到作用量函数S满足的方程，再从S出发得到体系的状态和演化规律。这里的作用量函数S(q,t)，定义从某初始点q0,t0出发到达q,t的真实轨迹的作用量。

最小作用量原理最大的好处在于普遍性，不管描述体系的参量是什么参量，都可以纳入最小作用量原理的形式。力学中，如果我们考虑的不是只用位置等有限参量就可以描述的质点和刚体，而是刚体甚至弹性体、流体，只要我们能找到描述其状态的方法（比如弹性体的形变大小和流体不同点的速度分布），就可以想方设法引入拉格朗日量，并用最小作用量原理表述体系的物理规律。又比如真空中的电磁场，引力场乃至强、弱相互作用场，其体系的演化规律都可以用最小作用量原理表示，只不过描述系统状态的量为每一点的场强或势。

最小作用量原理的另一个好处在于易于表现系统对称性。现代数学物理学中，对称性被定义为体系经过某种操作而在我们所关注的方面不发生变化的性质。比如常说的人的左右对称性，即是交换左右部分人的外观不发生变化（内脏位置显然变了）。下面列出了几个常见的对称性：

1. 空间平移对称性：系统空间坐标平移一个矢量，即x->x+a,y->y+b,z->z+c的操作，不改变系统的任意状态。换句话说，系统中坐标为(x,y,z)处的物理状态和(x+a,y+b,z+c)处的物理状态完全一样，因此系统在平移后和原先重合。

2. 空间反演对称性：系统空间坐标全部反号，即x->-x,y->-y,z->-z的操作，不改变系统的任意状态。这意味着系统原本(x,y,z)处物理状态和(-x,-y,-z)处一致。

3. 时间平移和时间反演：系统时间平移一个量，如t-t+T；时间变为-t。

需要说明的是，时间反演并不等于时间倒流，而不过是运动过程的倒放而已。有趣的是前面所说的镜面对称操作（左右对称）实际上可以用上面1、2两种对称操作表达，具体方法请读着思考。

自从相对论建立以来，对称性研究已经是物理学的一个基本方法。相对论的基本原理要求物理定律在参考系变换下不变。具体说来，当我们进行参考系变换时，描述体系的物理定律不能发生变化。这在最小作用量原理表述的物理规律中，非常容易实现——只要要求对任意时空轨迹，作用量不随参考系变换而改变即可。因为只有这样，在不同参考系下筛选轨迹时才能得到同一个真实轨迹。沿着这一思路，数学家Noether从最小作用量原理进而证明，体系的任何一个对称性都对应保证体系存在一个守恒量。这就把对称性和守恒量联系了起来。具体地说，她证明了体系空间平移不变性（作用量S在空间平移下不变）

反过来说，在现代物理学中，对称性已经是确定体系拉格朗日量的最重要方法。如场论中的规范对称性。为了理解场的规范不变性，我们先简单介绍一点量子力学知识。

一点量子力学知识。首先量子力学有一个很基本的概念：测量将会引起被测量物体的改变，这本是经典物理学中也常见的概念，但实际上由于微观粒子各物理量很小，很容易受到测量的影响，而测量所用微观粒子（如光子）也有最小单位，使得测量工具无法无限细致，这样这一点就更加明显。更重要的是，实验表明微观下的测量，往往会根本性地改变系统的性质。比如让电子打向开有两个平行狭缝的平板，再在平板后放置显示屏，则电子将在屏幕上形成干涉图样（这来自于微观粒子波粒二象性）。而当我们对单个电子测量其从哪个缝走过时，干涉图样竟然自动消失了！另一方面，我们知道微观粒子有波粒二象性，即粒子的运动本质上要用波（物质波，或德布罗意波）来描述。经典力学告诉我们，波可以用空间分布的复振幅来描述，或者说用不同位置处波动的振幅和相位来描述，这对一个粒子来说是什么意思呢？

根据物理学家玻恩的理解，既然当一大堆粒子一起运动时，波动描述了粒子的运动，那么从经典力学上又能证明波的模方正比于波携带的能量，再加上德布罗意波的E=hf关系，容易发现波函数的模方实际上正比于每一点处的粒子数，这应该正比于单个粒子在空间某点出现的概率，以上诠释很快被物理学界接受，称为波函数的概率诠释。而相位概念则比较麻烦，似乎很难找到对应的物理意义，但实际上相位有着极为丰富和精巧的物理含义，且看下文分析。

由于对物质波的概率诠释和上述关于测量的分析，我们发现，微观粒子的多个物理量往往不可能同时测准。譬如位置和动量，就是一对不能同时测准的物理量。更精确地说动量的不确定度乘以位置的不确定度大致与一个常数h在同一数量级，这个原理称为不确定性原理或测不准原理。对于各种更加复杂的系统，也可以发现其某些物理量之间有这类关系。总而言之，为了描述粒子或其它量子系统的状态，我们要用到在时空分布的复值函数：波函数psi，根据上面的分析|psi|^2为概率分布，而psi我们称为概率幅分布。至于在量子场论中，粒子本质上被看做是场，粒子波函数psi于是被看做描述场的物理量，像位置、速度出现在粒子经典拉格朗日量中一样，出现在场的拉格朗日量中。举个例子，当电子被看做场时，电子波函数就提升为电子场的场量，和电磁场的电势、磁矢势异曲同工。

有了上面的知识，我们可以对量子场论中一个非常重要的概念：规范场理论有一定了解了。由于概率才是物理上有意义的量，如果场（波函数）整体乘以一个e^ia,a为任意实数，则概率在空间处处不变，体系状态应该不变。这种不变性（对称性）首先限制了体系的拉格朗日量的可能形式，并导致了所谓“荷守恒”，如电子场（将电子看做场得到psi）对应电荷守恒。然而，现代物理学家发现我们可以引入更精密的一种对称性，它要求场乘以一个e^ia(x)，其中a(x)是任意时空位置的函数时，体系拉格朗日量也不发生改变。别看这只是小小的一个改变，它可是一出现就迅速成为粒子物理学家的宠儿，自20世纪中叶为著名物理学大师杨振宁和米尔斯发现这种对称性后，它已经成为现代量子场论的根基。这是因为结合微分几何的数学工具，这种对称性可以很好地确定各种相互作用的拉格朗日量。

4.最小作用量原理的物理背景

虽然从数学上说，最小作用量原理可以没有物理意义，而这种普适性也一度成为其优点，但如果能找到合理的物理诠释当然更好。在20世纪，著名物理学家费曼就发现了如何用量子力学解释最小作用量原理的方法。

原来如前所述，量子力学中用波函数描述系统状态，而作为复值函数的波函数可以写为Aexp(iS/hbar)的形式（hbar=h/2pi），其中A和S都是时空的函数。早在量子力学建立之初，科学家就意识到量子力学基本方程薛定谔方程，在令普朗克常量趋于0时，应该恢复到经典力学，这被称为量子力学的准经典近似。而实际上，当h趋于0时，薛定谔方程和最小作用量原理形式的经典力学中的一个基本方程，哈密顿-雅克比方程直接对应，而波函数中的S正好过渡到S0，与哈-雅方程中出现的作用量对应。这是为我们理解最小作用量原理提供了钥匙。

后来，物理学家费曼提出了另一种不同的量子力学形式。在他看来，量子力学中粒子不仅可以具有确定的轨迹，还同时在每一个轨迹上运动，只有当外界物理环境逼的粒子不得不现身的时候（测量），粒子才会出现在某个固定的位置。在费曼之前，人们已经可以用薛定谔方程计算粒子从一点运动到另一点的概率和概率幅（初末处有位置测量仪器），而费曼引入了粒子沿不同轨迹的概率幅，并认为这些概率幅相加才是总概率幅。具体来说，粒子从A点沿某路径到达B点的概率幅，可以写成exp(iS/hbar)的形式，随路径不同有不同的S。从前面关于准经典近似的讨论中得到启发，对任意轨道，S应该都等于其作用量。然后我们将所有不同路径的贡献叠加，也就得到了从一点到另一点的总概率幅。这被称为量子力学的路径积分形式。从这种形式出发，我们只要知道了经典情形下系统的拉格朗日量L，就可以得到任何一条路径的作用量S，接着如果我们把它看做量子力学中沿此轨迹概率幅的相位，就可以把经典理论整个过渡到量子形式。这种过程因而被称为路径积分量子化。在现代的物理学研究中，物理学家往往先通过对称性原理等基本法则寻找系统的拉格朗日量，然后再用量子化的方法过渡量子理论。不管是单个的电子、质子，还是电子场、光子场乃至夸克、胶子场的量子理论，都可以通过这种方法得到。

现在让我们把路径积分和最小作用量原理联系起来。前面我们知道，准经典近似下总复振幅的相位S过渡到S0，即经典力学中的作用量。所以现在我们的问题就是，当h趋于0时，总复振幅的相位是否趋于经典力学中的真实作用量，即满足最小作用量原理？答案是肯定的。原因需要仔细考察exp(iS/hbar)。我们看到h趋于0时，S的前面实际上乘了一个很大的系数，这样设在轨道1上S取最小值S0，则在任意偏离1的轨道上，S都会剧烈的偏离S0，且随着轨道的改变迅速增大。如果我们用复平面上的矢量表示复振幅exp(iS/hbar)，则会发现随着S偏离S0，复振幅对应的矢量在复平面上迅速旋转，由于每转一圈所有复振幅都抵消掉，所以可见当h很小时，偏离S0的所有复振幅实际上都在迅速旋转（振荡）中抵消掉了。于是最后的总复振幅实际上是S0。

细心的读者会发现，如果S0不是取值最小的作用量，而是最大的，甚至只是取驻值，都会有以上结论。实际上确实如此，严格来说最小作用量原理不是要求真实轨道作用量最小，而是真实轨道作用量取驻值（平稳值）。

这样，我们就成功的用量子力学解释了经典体系的最小作用量原理。从我们推理可以看出，真正真实的是量子力学的相位，而最小作用量原理只是量子力学路径积分原理在宏观尺度下的退化形式。那么，对最小作用量原理的理解，到此为止了吗？也许是，但即便如此，理解量子力学相位的物理意义又将是一个新的难题。费曼用他的天才挖开了上帝的储藏柜，为我们带来了一个答案，那下一个答案会又来自谁呢？

phymath999

Tuesday, December 11, 2012

No comments:

Post a Comment