量子力学和分析力学的相似性
来源: 陈成的日志
一直在想四大力学的联系,尤其最近知道了路径积分是量子与统计的共同基础之后,便怀疑电动力学是否也能纳入到这一框架下。泰勒《自然规律中蕴蓄的统一性》暗示了我们,从经典力学、几何光学、电磁学、量子力学到广义相对论、相对论热力学,作用量无处不在。其普适性,恰如对称性与守恒律(诺特定理)。在google上搜索相关文献,无意中发现一篇奇文,摘录如下:
1.经典力学
最小作用量原理的数学形式的δS=δ∫Ldt=0,我们称S为作用量,δ是变分计算,L(q,dq/dt,t)是拉格朗日函数,力学中常用的形式是L=T-V(也就是动能减去势能,真是个奇怪的数!),由此可以推得拉格朗日方程:d/dt·∂L/∂q^-∂L/∂q=0(记广义坐标q对时间的微商dq/dt=q^)。一般大可以认为拉格朗日方程就相当于牛顿方程,但是它比牛顿方程多一些东西——广义坐标并不像牛顿方程中使用的坐标那样必须是位形空间中的坐标,即使你要抱怨q和x相比形式上只不过是换了一个字母而已,但q的含义确实比x要更广泛的多。
除了拉格朗日方程以外,我们还有两样宝——哈密顿正则方程:q^=∂H/∂p,p^=-∂H/∂q(其中H是哈密顿量,它一般等于T+V,但切记并不是所有时候都是这样的,在这里,我们记dq/dt=q^,dp/dt=p^);以及哈密顿-雅可比方程:∂S/∂t+H(p,q,t)=0,这个方程的参数已经不是q,dq/dt,t而是p,q,t,实际上正则方程中我们已经是这样应用的了。物理学家普遍这么说:正则方程是在以p与q为坐标撑开的相空间中的运动方程——虽然沈慧川先生一再批评这个观点,但我们依然认为他的批评是完全可以无视的。
我相信没有学过经典力学(理论力学)的网友们已经被这点东西给弄糊涂了,他们有些人甚至不熟悉微积分!但是没有关系,我们应当鼓励物理学爱好者先弄懂数学,而不要对他们采取不屑的态度。我想说的是,虽然很多爱好者一再避之,但数学实际上并没有想象中的那么可怕,所有人都能行。
2.电磁学
一提起电磁学,问题就与相对论就有着不可割裂的联系了,朗道在他的经典场论中精辟的论述至今让我流连忘返。在通过一些基本问题的讨论中得到了电磁场张量F_{μυ}以及它的逆变张量F^{μυ}和四维电流密度J_{μυ}、四维矢势A^{μυ}后(在形式上,这些四维张量无非就是写4×4矩阵而已,计算起来也是如此),我们凑出拉格朗日密度L~=-1/4·F_{μυ}F^{μυ}+4π/c·J_{μυ}A^{μυ}(注意这不是拉格朗日函数,两者的关系是L=∫L~dV,其中V是体积),很难理解?我们暂时去掉“源”的那一项,这样的话,不考虑受到激发的自由电磁波的拉格朗日密度就是L~=-1/4·F_{μυ}F^{μυ},把其中所有项写开来就是L~=1/2·εE²-1/2·(1/μ)B²,觉不觉的和弹簧振子的拉格朗日函数L=1/2·mv²-1/2·kx²很像?这就是电场与磁场交互激发,此消彼长的电磁波啊!由此再通过最小作用量原理(实际上是通过连续体的拉格朗日方程)可以计算得出麦克斯韦方程组:
▽×E=-∂B/∂t——法拉第电磁感应定律,电场旋度与磁场变化之间的关系;
▽×B=μj+με∂E/∂t——麦克斯韦电位移定律,磁场旋度与电场变化之间的关系;
▽·E=ρ/ε——电场E散度与电荷密度ρ之间的关系,也就是说电场是有源场;
▽·B=0——磁场B散度等于0,也就是说磁场是无源场。
当然以上内容在初学者眼里,尤其是微积分都不熟悉的初学者眼里,会是很难理解的——你无法期望一个不大懂得微积分的人能理解磁场B的散度等于零是什么意思,它与场的无源性质有什么样的关联。
3.量子力学
几乎是经典的物理系统的波函数是这样的:ψ=Cexp[iS/h~]。一般来说,平面波波函数应该是Cexp[i(px-Et)/h~],而为了引入作用量,考察px-Et具有能量×时间的量纲,这正好与作用量S不谋而合。
量子力学有三种基本的描述方法,一种是用薛定谔方程,另外一个是海森堡给出的,第三种形式最漂亮的当属费曼给出的路径积分,可以由路径积分推得薛定谔方程,但这并不是本篇文章想要说的,这里想说的是,作用量在量子世界中也具有一席之地。求∂ψ/∂t,我们得到的是∂ψ/∂t=i/h~·∂S/∂t·ψ。如果你还记得哈密顿-雅可比方程∂S/∂t+H=0,只消再用上它,我们就可以推得薛定谔方程:ih~∂ψ/∂t=Hψ——当然,这里的H并非哈密顿量,而是哈密顿算子了。
4.热力学
本来通过统计力学,以配分函数定义几个热力学函数,再以路径积分的方法求其配分函数,基本上这方面的问题就与最小作用量原理相结合了起来,但我们现在讨论的却是热力学与最小作用量原理的相关话题。这货首先是由亥姆霍兹提出的,有兴趣的童鞋可以翻翻史料,这部分内容大概仅仅具有类比和启发的意义,而没有更深层的意义了,所以很难在教本中——尤其是中国的教科书中找到这些内容。
首先,描述系统所用的作用量应当是一个在时空中的不变量(与朗道的《经典场论》中的某一段很相似?),我们有∫Ldt=∫L0dt0,然而dt与dt0之间是有着相对论钟慢效应的,所以L与L0之间也差一个洛伦兹因子。而相对论热力学给出熵、压强乃是相对论不变的,而体积、温度、内能则是反变的(γ^(-1))。于是我们构造出如下拉格朗日量:L=TS-U.则可以与经典力学的哈密顿量定义做比较,套用正则方程,得到热力学第一定律的方程:
dU=TdS-PdV.这一点我曾发过,但几乎未引起任何人的注意。
5.广义相对论
为了建立引力场方程,在这里我们依然寻找引力场的拉格朗日密度,进而将最小作用量原理写出来。采用如下记号:R是标量曲率张量,g是度规,Ω的时空的“体积”。那么可以证明√-g·R就是我们要找的拉格朗日密度,它是最简单的形式,至多还差一个常系数α,最小作用量原理写做:δS=δ{α∫√-g·RdΩ}=0.通过硬算(算了一页纸,这种东西就需要你跟它死磕),我们得到无源引力场方程:R_{μυ}-1/2·g_{μυ}R=0.我们在这里最好先不要考虑引力场源,在完成无源场方程后,我们不要忘记再添上引力场源那一项就好:R_{μυ}-1/2·g_{μυ}R=kT_{μυ}——右侧的T_{μυ}是表示场源物质的能量动量张量,而k则是一个系数。这个方程就是爱因斯坦给出的引力场方程。当然只有引力场方程还不够,我们还需要运动方程,也就是测地线方程,通过δS=δ∫ds=0,我们就可以得到测地线方程:d²x^{μ}/dτ²+Γ^{μ}_{λσ}·dx^{λ}/dτ·dx^{σ}/dτ。如果让Γ^{μ}_{λσ}=0,看看d²x^{μ}/dτ²=0这形式,它与牛顿力学中匀速运动的加速度a=d²x/dt²=0如出一辙。
除此之外,光学尚有费马定理δ∫nds=0,其中n是折射率,而ds是光走过的一小段路线,由此是可以推得光学的一些基本定理的;环顾当今理论物理学研究前沿,无论是基本的量子场论还是超弦理论、M理论,物理学家构建物理学大厦时,总是要先找到拉格朗日量和作用量。
【评述】:最小作用量原理是分析力学的灵魂,而分析力学是牛顿力学形式化的结果,可见数学形式的完备化对于理论物理的深远影响。欲穷千里目,更上一层楼。如果理论物理想看得更远,需要站在巨人——“数学”的肩膀上。这就是“数学物理”这门学科的深远意义。请那些鄙视数学的“实验物理学家”们深思。
至于那位“实验物理学家”的关于“为什么数学会使物理上升为艺术”的疑问,可参考“宇宙的心弦”《作用量与物理之美》(系列博文)
最小作用量原理与物理之美1——导言
爱因斯坦说过:“我想知道上帝是如何设计这个世界的。对这个或那个现象、这个或那个元素的谱我不感兴趣。我想知道的是他的思想,其他的都只是细节问题。”近代物理隐隐约约的表明,我们人类似乎已经接近于上帝的终极设计了,最小作用量原理、对称与守恒可能就是上帝设计世界的原则。最小作用量原理、对称与守恒不同于F=ma、F=GMm/r^2、F=kx、F=kQq/r^2这类的普通物理定律,他是物理定律的定律,是一切其他普通物理定律的基础。
最小作用量原理是一个令人神往的课题,费恩曼上高中时听到他的老师巴德给他讲的时候就被深深震撼了,我也是一样。当我第一次从费恩曼的书中看到这个原理时,真是有种无法言表的喜悦,好像是我窥见了上帝设计世界的图纸一般。后来我就如饥似渴的学习者有关引人入胜的最小作用量原理的知识,同时越来越被这伟大的原理所吸引。
最小作用量原理这个伟大的思想应该被优秀的中国学生所充分了解,可是据我所知我们班以前除我之外没有人听说过它,在我的积极推广之后才有一些人知道了这么个东西,而利用这个周六的一个交流机会我才把最小作用量原理讲给全班同学听了。从个人角度来说,我认为人活在世上不知道最小作用量原理是一大憾事;从民族的角度来说,一个民族不具备先进的物理思想是很难在科学上引领全世界的,也就是生产力的巨大飞跃总是先发生在外国,我们跟着学而已。古中国文化昌盛,可是却不具备完整科学的思想,看看古代的科技类的书才有多么点,而其中技术类和理论类的比值又是多么高。因此古中国的科技并没有什么突破,蒸汽机、发电机等革命性的发明就不属于中国。而西方从欧几里得、毕达哥拉斯开始就试图建立科学的理论体系,后来牛顿又为科学界作出了一个建立理论体系的表率。西方的科学重思想、重理论、重基础研究,等这些成熟了,技术的飞跃就指日可待了。因此物理思想是非常重要的,重要性远远超过知识本身,尤其是最小作用量原理这样深刻、神奇的物理思想,更应该被我们优秀的中国中学生所掌握。因此,我就在这里担当一个传播者的角色,把这一思想传播给本博客的读者们。
作用量这个概念还是比较抽象的,我不想一上来就给作用量下定义,这样会很难理解,我会在之后的几篇文章中由浅入深的介绍。
先看一个最简单的例子,如图,两个电阻R1、R2并联,输入的电流为I,求I1、I2是多少。这个问题初中生都会做,用并联时电压相等加上欧姆定律就可以作了。可以容易的求得
现在我们换一种方法:I1、I2的取值使得热功率最小。根据焦耳定律有
为了取得P的最小值我们对上式两边求导(以I1为自变量)。
可得 再利用I=I1+I2亦可得
求P的二阶导数发现>0,果然是极小值。
静电平衡也可以用两种方式来解释。为了得到电荷总是分布在导体的表面这个结论,我们一方面可以利用电荷之间互相排斥来说明;另一方面,我们可以利用导体的静电能最低来求出电荷的分布。
看一个小题:半径分别为r和R的同心金属球面以细导线相连,已知整个系统带有电荷Q,求静电平衡时,内求所带的电荷q。
我们现在用静电能最低来证明q=0。设静电能为W,则
为了求得W的最小值两边求导(以q为自变量)
因为r<>R所以q=0。 求W的二阶导数发现>0,果然是极小值。
再来看一个例子。如图那样把一个铁链子的两端系在水平的棒上,铁链子会形成一个美妙的曲线(悬链线)。为了计算这条曲线的方程,我们可以用受力分析来做,但还有另一种方法,即铁链子的真实形状使得其重力势能最低。你无论怎么改变铁链子的形状,得到的重心总会比真实情况高。
水珠也很有代表性。如果在太空中忽略重力,那么水珠会成为球形——相同体积的所有立体图形中表面积最小的,在物理中我们说表面势能最小(表面张力会使液体有一个表面势能,其大小正比于液体表面积)。如果考虑重力,液体的形状会是怎样的呢?是哪一个量取最小值呢,重力势能还是表面势能?聪明的造物主选择了这么一个量:重力势能加上表面势能最低。重力尽可能的把重心往下拽,表面张力又尽可能的使液体保持球形,最后就形成了一个扁扁的类似椭球的形状(不考虑液体与地面之间的分子力)。
以上种种现象表明,造物主似乎是个精明的经济学家,他总是尽心设计物理定律使得“成本”最小。很久以前,人们认为这些极值问题仅仅是一些物理定律的偶然结果,可是随着理论的发展,人们似乎慢慢认识到极值才是宇宙中最本质的定律。在今天,物理学家们已经找到了一种以统一的形式和精确的数学去描述这些极值问题的原理——最小作用量原理。
其中,δ是变分符号,p1、p2表示空间中两个固定点,n为介质的折射率,s表示路程。为了理解上式的含义,我们需要和导数做一个类比。我们对一个函数求导数,如果导数值等于零,那么可以判断出原函数在该点处会取得极小值、极大值或恒定值。上面的式子和导数有一个显著的不同,导数研究的是以字母为自变量的函数的极值,而上式想求的则是以一个函数(位置随时间变化的函数)为自变量的泛函的极值。我们把每一条路径看作是位置随时间变化的函数,把这个函数看作自变量,我们要求的则是各条路径中光程取极值的那条路径;就像我们求导求的是各个x中使得y取极值的那个点。函数求极值可以用导数,泛函求极值则可以用变分法,即δS=0(其中S是一个泛函)。大家就把δ理解成和导数相类似的东西就可以了。大家可能还见过费马原理的另一种表述:过空间中两定点的光,实际路径总是时间最短、最长或恒定值的路径。就是把光程换成时间t了,即:
这两种表述是等价的,因为
上面推导中v表示光在某介质中的传播速度(v=c/n),c表示真空中光速(是个常数),其余字母的解释和前面一样。
在几何光学中,我们把作用量S定义为
也就是说作用量在几何光学中的形式就是等号右边的那部分。
有了费马原理,就有了全部几何光学,我们可以从费马原理出发退出所有的几何光学定理。这是费马原理的强大威力之一。首先看最简单的,光在同种均匀介质中沿直线传播,从费马原理当然一眼就能推出来。光走其他的路径肯定比直线所花的时间要长(暂不讨论广义相对论中的时空弯曲)。
再来证明平面镜反射中反射角等于入射角。我们把S点对称到平面镜的另一边,用直线联结S’与P,得到的就是时间最短的路径,联结SO,通过简单的平面几何知识就可以得到反射角等于入射角的结论。
折射定律亦可以从费马原理推出来,但是稍显麻烦,在这里就不定量讨论了。我想说的是光之所以发生折射确实是因为光走那条关了一道弯的路径是时间最短的。记得很小的时候我就知道光可以发生折射,可是我就一直弄不明白好端端的直线光为什么不走,非要走一条怪异的拐弯的路线。我曾经问过很多老师光为什么会发生折射,他们都没有给我满意的答复,直到我看见了费马原理才彻底弄明白了这个问题。
下面我要重点说一下费马原理如何简洁的证明圆锥曲线的光学性质。这里的圆锥曲线都被镀上了一层银,可以当镜子用。
(1)从椭圆一个焦点发出的光,经过椭圆的反射,会汇集到另一个焦点上。证明:根据椭圆的定义,F1P+PF2=定值,根据费马原理,光的实际路径是光程极小、极大或定值的路径,所以F1到圆锥曲线上任意一点再到F2是光走的实际路径,所以从F1发出的光经过圆锥曲线反射会汇集到F2。
(2)从抛物线的焦点发出的光,经过抛物线反射会形成平行光束。证明:做出抛物线的准线,F1P等于P到准线的距离,即这两段光程相等。光的实际路径至于光程的取值有关,所以从F1发出的经过抛物线反射的光和直接从准线向右发出的光完全等效,因此从F1发出的光,经过抛物线反射会形成平行光束。
(3)从双曲线的一个焦点发出的经过双曲线反射形成的光,好像是从双曲线的另一个焦点直接发出的。证明:因为F1P-F2P=定值,所以对极值的取得没有影响,即从F2发出的经过P反射的光与从F1直接发出的经过P的光取极值的路径相同,即路径是一样的。故证明了双曲线的光学性质。
要知道,从数学上证明上述性质是相当麻烦的,而有了费马原理则可以几句话就把问题解决,一点高深的数学也没用。这是费马原理的另一个强大威力。
至于费马原理为什么是对的,《费恩曼物理学讲义 第二卷》第19章给出了一个精彩阐述。他是这么说的:“要是他遵循一条需要不同时间的路径,则当它到达时就有不同相位。而在某一点上的总振幅等于光能到达的所有不同路径振幅贡献的总和。所有那些提供相位差异很大的路径将不会合成任何东西。但如果你能找出一整序列路径,他们都具有几乎相同的相位,则小小的贡献便将加在一起而在到达之处得到一个可观测的总振幅。因此,重要路径就成为许多能给出相同相位彼此靠近的路径。”而只有时间取极值的那条路径,才能保证路径有微小变化时时间保持不变(再次与导数类比,函数取极值的那个点,当x有微小变化Δx时,Δy=Δx*y’=0,其余的点Δy都是一个不为0的数)。因此,时间取极值的路径被叠加了,成为了实际路径,而其余的任何可能路径都被不同的相位给抵消没了。
这个甚至可以解释光的衍射现象。当我们用一个很细的狭缝来挡住一部分光时,时间不取极值的某些路径也因为有一部分光被挡住而不能很好的叠加为零,因此这种情况下光并不是总衍直线传播,而是产生了光可以绕到障碍物后面的的现象,即衍射现象。
我们已经看到了最小作用量原理在光学中的应用,它可以代替所有其他几何光学定律。下篇文章我将写最小作用量原理在力学中的特例,以及如何代替整个牛顿力学。
有这样一个事实:假定有一个质点在引力场中通过自由运动从某处移动至另一处——你把它抛出去,他就会上升又落下。如果画出x-t图(为了简化,只考虑一维的运动,设x轴是竖直的轴),那么运动图像是一条抛物线。你可以尝试着通过起点和终点画一些别的曲线,如果计算出经历整条路径期间动能减重力势能对时间的积分,你会发现所获得的数值比实际运动所获得的要大。如果我们设作用量S为
那么上面的事实换句话说就是作用量S在实际运动中取得最小值。对上面字母的解释:t1、t2表示运动的起点和终点时刻,1/2*m*v^2是研究物体的动能,V(x)是其势能(这里把它写成是随x变化的函数)。当物体只受重力的时候,V(x)=mgx。我们在上一篇文章中说过,一个泛函取得极值可以令其变分等于0,所以在力学中,最小作用量原理的特例就写作:
我们可以先定性的理解实际情况确实作用量最小。X增大时势能是增大的,作用量中势能前有个负号,所以应该在x比较大的时候多呆一段时间,而x比较小的地方尽可能快地往上爬,以保证动能减势能之差对时间累积之后尽可能小。
下面我想用基本的微积分变一个惊人的魔术:从最小作用量原理推导出牛顿第二定律F=ma!
我没完整学过变分法,因此我将主要根据《费恩曼物理学讲义 第二卷》第19章的内容,不直接用变分法而用高中生就能接受的初等的微积分来推导。
我们现在想要求的是一个泛函S的极值[之所以说S是泛函是因为,S的自变量是x随时间变化这个函数x(t)],可以类比当初学导数的过程。先回忆一下我们还没学求导公式的时候是怎么求导的:要求一个函数的极值,我们可以令x有一个无穷小的变化Δx,代入函数的表达之后运算并舍掉高阶无穷小量最后算出Δy,令导数等于Δy/Δx等于0即可求得y在何时取得极值。我们将模仿上述过程求泛函S的极值。
先进行一些前期工作。首先把v换掉,根据v是x对t的导数得到
在下面的推导中,为了方便有时把x(t)简写作x。我们称真实路径为x0(t),而x(t)则表示某条假想的尝试路径。我们设真实路径与实际路径有一微小差别(当作小量)记作η(t)。同样为了方便有时把η(t)简写作η。因为我们的数学模型规定了p1、p2是空间中两个固定点,因此有η(t1)=0,η(t2)=0(这个规定是必须的,否则得不到任何有价值的东西)。
有了上面这些东西,我们开始对S进行运算。
忽略掉高阶无穷小,即含有η^2或更高次幂的项,得到
下面对V(x0+η)变形,如果知道泰勒级数的人可以容易的理解V(x0+η)如何展开,如果不知道的话也不要紧,类比导数(类比导数是多么重要啊!!!)。
我们知道y可以写作y=y0+Δy=y0+y’*Δx,其中y表示y对x的导数。那个η和Δx地位是相当的,V(x)和y地位是相当的,类比着我们可以写出
其中V’表示V的导数。所以
还记得δS的定义吧,它就是我们的尝试路径得到的S减去实际路径得到的S0。所以
现在的问题是,这里是某个积分,虽然我们还不知道x0是什么,但是我确实知道不管η是什么,这一积分必须恒为零。
我们需要做的是把积分号里面那
1.经典力学
最小作用量原理的数学形式的δS=δ∫Ldt=0,我们称S为作用量,δ是变分计算,L(q,dq/dt,t)是拉格朗日函数,力学中常用的形式是L=T-V(也就是动能减去势能,真是个奇怪的数!),由此可以推得拉格朗日方程:d/dt·∂L/∂q^-∂L/∂q=0(记广义坐标q对时间的微商dq/dt=q^)。一般大可以认为拉格朗日方程就相当于牛顿方程,但是它比牛顿方程多一些东西——广义坐标并不像牛顿方程中使用的坐标那样必须是位形空间中的坐标,即使你要抱怨q和x相比形式上只不过是换了一个字母而已,但q的含义确实比x要更广泛的多。
除了拉格朗日方程以外,我们还有两样宝——哈密顿正则方程:q^=∂H/∂p,p^=-∂H/∂q(其中H是哈密顿量,它一般等于T+V,但切记并不是所有时候都是这样的,在这里,我们记dq/dt=q^,dp/dt=p^);以及哈密顿-雅可比方程:∂S/∂t+H(p,q,t)=0,这个方程的参数已经不是q,dq/dt,t而是p,q,t,实际上正则方程中我们已经是这样应用的了。物理学家普遍这么说:正则方程是在以p与q为坐标撑开的相空间中的运动方程——虽然沈慧川先生一再批评这个观点,但我们依然认为他的批评是完全可以无视的。
我相信没有学过经典力学(理论力学)的网友们已经被这点东西给弄糊涂了,他们有些人甚至不熟悉微积分!但是没有关系,我们应当鼓励物理学爱好者先弄懂数学,而不要对他们采取不屑的态度。我想说的是,虽然很多爱好者一再避之,但数学实际上并没有想象中的那么可怕,所有人都能行。
2.电磁学
一提起电磁学,问题就与相对论就有着不可割裂的联系了,朗道在他的经典场论中精辟的论述至今让我流连忘返。在通过一些基本问题的讨论中得到了电磁场张量F_{μυ}以及它的逆变张量F^{μυ}和四维电流密度J_{μυ}、四维矢势A^{μυ}后(在形式上,这些四维张量无非就是写4×4矩阵而已,计算起来也是如此),我们凑出拉格朗日密度L~=-1/4·F_{μυ}F^{μυ}+4π/c·J_{μυ}A^{μυ}(注意这不是拉格朗日函数,两者的关系是L=∫L~dV,其中V是体积),很难理解?我们暂时去掉“源”的那一项,这样的话,不考虑受到激发的自由电磁波的拉格朗日密度就是L~=-1/4·F_{μυ}F^{μυ},把其中所有项写开来就是L~=1/2·εE²-1/2·(1/μ)B²,觉不觉的和弹簧振子的拉格朗日函数L=1/2·mv²-1/2·kx²很像?这就是电场与磁场交互激发,此消彼长的电磁波啊!由此再通过最小作用量原理(实际上是通过连续体的拉格朗日方程)可以计算得出麦克斯韦方程组:
▽×E=-∂B/∂t——法拉第电磁感应定律,电场旋度与磁场变化之间的关系;
▽×B=μj+με∂E/∂t——麦克斯韦电位移定律,磁场旋度与电场变化之间的关系;
▽·E=ρ/ε——电场E散度与电荷密度ρ之间的关系,也就是说电场是有源场;
▽·B=0——磁场B散度等于0,也就是说磁场是无源场。
当然以上内容在初学者眼里,尤其是微积分都不熟悉的初学者眼里,会是很难理解的——你无法期望一个不大懂得微积分的人能理解磁场B的散度等于零是什么意思,它与场的无源性质有什么样的关联。
3.量子力学
几乎是经典的物理系统的波函数是这样的:ψ=Cexp[iS/h~]。一般来说,平面波波函数应该是Cexp[i(px-Et)/h~],而为了引入作用量,考察px-Et具有能量×时间的量纲,这正好与作用量S不谋而合。
量子力学有三种基本的描述方法,一种是用薛定谔方程,另外一个是海森堡给出的,第三种形式最漂亮的当属费曼给出的路径积分,可以由路径积分推得薛定谔方程,但这并不是本篇文章想要说的,这里想说的是,作用量在量子世界中也具有一席之地。求∂ψ/∂t,我们得到的是∂ψ/∂t=i/h~·∂S/∂t·ψ。如果你还记得哈密顿-雅可比方程∂S/∂t+H=0,只消再用上它,我们就可以推得薛定谔方程:ih~∂ψ/∂t=Hψ——当然,这里的H并非哈密顿量,而是哈密顿算子了。
4.热力学
本来通过统计力学,以配分函数定义几个热力学函数,再以路径积分的方法求其配分函数,基本上这方面的问题就与最小作用量原理相结合了起来,但我们现在讨论的却是热力学与最小作用量原理的相关话题。这货首先是由亥姆霍兹提出的,有兴趣的童鞋可以翻翻史料,这部分内容大概仅仅具有类比和启发的意义,而没有更深层的意义了,所以很难在教本中——尤其是中国的教科书中找到这些内容。
首先,描述系统所用的作用量应当是一个在时空中的不变量(与朗道的《经典场论》中的某一段很相似?),我们有∫Ldt=∫L0dt0,然而dt与dt0之间是有着相对论钟慢效应的,所以L与L0之间也差一个洛伦兹因子。而相对论热力学给出熵、压强乃是相对论不变的,而体积、温度、内能则是反变的(γ^(-1))。于是我们构造出如下拉格朗日量:L=TS-U.则可以与经典力学的哈密顿量定义做比较,套用正则方程,得到热力学第一定律的方程:
dU=TdS-PdV.这一点我曾发过,但几乎未引起任何人的注意。
5.广义相对论
为了建立引力场方程,在这里我们依然寻找引力场的拉格朗日密度,进而将最小作用量原理写出来。采用如下记号:R是标量曲率张量,g是度规,Ω的时空的“体积”。那么可以证明√-g·R就是我们要找的拉格朗日密度,它是最简单的形式,至多还差一个常系数α,最小作用量原理写做:δS=δ{α∫√-g·RdΩ}=0.通过硬算(算了一页纸,这种东西就需要你跟它死磕),我们得到无源引力场方程:R_{μυ}-1/2·g_{μυ}R=0.我们在这里最好先不要考虑引力场源,在完成无源场方程后,我们不要忘记再添上引力场源那一项就好:R_{μυ}-1/2·g_{μυ}R=kT_{μυ}——右侧的T_{μυ}是表示场源物质的能量动量张量,而k则是一个系数。这个方程就是爱因斯坦给出的引力场方程。当然只有引力场方程还不够,我们还需要运动方程,也就是测地线方程,通过δS=δ∫ds=0,我们就可以得到测地线方程:d²x^{μ}/dτ²+Γ^{μ}_{λσ}·dx^{λ}/dτ·dx^{σ}/dτ。如果让Γ^{μ}_{λσ}=0,看看d²x^{μ}/dτ²=0这形式,它与牛顿力学中匀速运动的加速度a=d²x/dt²=0如出一辙。
除此之外,光学尚有费马定理δ∫nds=0,其中n是折射率,而ds是光走过的一小段路线,由此是可以推得光学的一些基本定理的;环顾当今理论物理学研究前沿,无论是基本的量子场论还是超弦理论、M理论,物理学家构建物理学大厦时,总是要先找到拉格朗日量和作用量。
【评述】:最小作用量原理是分析力学的灵魂,而分析力学是牛顿力学形式化的结果,可见数学形式的完备化对于理论物理的深远影响。欲穷千里目,更上一层楼。如果理论物理想看得更远,需要站在巨人——“数学”的肩膀上。这就是“数学物理”这门学科的深远意义。请那些鄙视数学的“实验物理学家”们深思。
至于那位“实验物理学家”的关于“为什么数学会使物理上升为艺术”的疑问,可参考“宇宙的心弦”《作用量与物理之美》(系列博文)
最小作用量原理与物理之美1——导言
爱因斯坦说过:“我想知道上帝是如何设计这个世界的。对这个或那个现象、这个或那个元素的谱我不感兴趣。我想知道的是他的思想,其他的都只是细节问题。”近代物理隐隐约约的表明,我们人类似乎已经接近于上帝的终极设计了,最小作用量原理、对称与守恒可能就是上帝设计世界的原则。最小作用量原理、对称与守恒不同于F=ma、F=GMm/r^2、F=kx、F=kQq/r^2这类的普通物理定律,他是物理定律的定律,是一切其他普通物理定律的基础。
最小作用量原理是一个令人神往的课题,费恩曼上高中时听到他的老师巴德给他讲的时候就被深深震撼了,我也是一样。当我第一次从费恩曼的书中看到这个原理时,真是有种无法言表的喜悦,好像是我窥见了上帝设计世界的图纸一般。后来我就如饥似渴的学习者有关引人入胜的最小作用量原理的知识,同时越来越被这伟大的原理所吸引。
最小作用量原理这个伟大的思想应该被优秀的中国学生所充分了解,可是据我所知我们班以前除我之外没有人听说过它,在我的积极推广之后才有一些人知道了这么个东西,而利用这个周六的一个交流机会我才把最小作用量原理讲给全班同学听了。从个人角度来说,我认为人活在世上不知道最小作用量原理是一大憾事;从民族的角度来说,一个民族不具备先进的物理思想是很难在科学上引领全世界的,也就是生产力的巨大飞跃总是先发生在外国,我们跟着学而已。古中国文化昌盛,可是却不具备完整科学的思想,看看古代的科技类的书才有多么点,而其中技术类和理论类的比值又是多么高。因此古中国的科技并没有什么突破,蒸汽机、发电机等革命性的发明就不属于中国。而西方从欧几里得、毕达哥拉斯开始就试图建立科学的理论体系,后来牛顿又为科学界作出了一个建立理论体系的表率。西方的科学重思想、重理论、重基础研究,等这些成熟了,技术的飞跃就指日可待了。因此物理思想是非常重要的,重要性远远超过知识本身,尤其是最小作用量原理这样深刻、神奇的物理思想,更应该被我们优秀的中国中学生所掌握。因此,我就在这里担当一个传播者的角色,把这一思想传播给本博客的读者们。
作用量这个概念还是比较抽象的,我不想一上来就给作用量下定义,这样会很难理解,我会在之后的几篇文章中由浅入深的介绍。
最小作用量原理与物理之美2——自然中无处不在的极值
观察自然界的各种现象,会发现极值往往出现。知道这一点非常重要,在最小作用量被明确提出之前,人们已经研究了很多极值问题。我们先来看一些比较简单的极值问题,会对最小作用量原理有一个更深刻的认识,也能从中看出最小作用量原理的起源与历史。物理定律都有两种表述形式:一种是普通的我们高中学的形式,用力、加速度、电场强度等概念描述的物理定律;另一种是极值的形式,在一个物理过程中某个量取得极值。这两种表述形式是等价的。先看一个最简单的例子,如图,两个电阻R1、R2并联,输入的电流为I,求I1、I2是多少。这个问题初中生都会做,用并联时电压相等加上欧姆定律就可以作了。可以容易的求得
现在我们换一种方法:I1、I2的取值使得热功率最小。根据焦耳定律有
为了取得P的最小值我们对上式两边求导(以I1为自变量)。
可得 再利用I=I1+I2亦可得
求P的二阶导数发现>0,果然是极小值。
静电平衡也可以用两种方式来解释。为了得到电荷总是分布在导体的表面这个结论,我们一方面可以利用电荷之间互相排斥来说明;另一方面,我们可以利用导体的静电能最低来求出电荷的分布。
看一个小题:半径分别为r和R的同心金属球面以细导线相连,已知整个系统带有电荷Q,求静电平衡时,内求所带的电荷q。
我们现在用静电能最低来证明q=0。设静电能为W,则
为了求得W的最小值两边求导(以q为自变量)
因为r<>R所以q=0。 求W的二阶导数发现>0,果然是极小值。
再来看一个例子。如图那样把一个铁链子的两端系在水平的棒上,铁链子会形成一个美妙的曲线(悬链线)。为了计算这条曲线的方程,我们可以用受力分析来做,但还有另一种方法,即铁链子的真实形状使得其重力势能最低。你无论怎么改变铁链子的形状,得到的重心总会比真实情况高。
水珠也很有代表性。如果在太空中忽略重力,那么水珠会成为球形——相同体积的所有立体图形中表面积最小的,在物理中我们说表面势能最小(表面张力会使液体有一个表面势能,其大小正比于液体表面积)。如果考虑重力,液体的形状会是怎样的呢?是哪一个量取最小值呢,重力势能还是表面势能?聪明的造物主选择了这么一个量:重力势能加上表面势能最低。重力尽可能的把重心往下拽,表面张力又尽可能的使液体保持球形,最后就形成了一个扁扁的类似椭球的形状(不考虑液体与地面之间的分子力)。
以上种种现象表明,造物主似乎是个精明的经济学家,他总是尽心设计物理定律使得“成本”最小。很久以前,人们认为这些极值问题仅仅是一些物理定律的偶然结果,可是随着理论的发展,人们似乎慢慢认识到极值才是宇宙中最本质的定律。在今天,物理学家们已经找到了一种以统一的形式和精确的数学去描述这些极值问题的原理——最小作用量原理。
最小作用量原理与物理之美3——费马原理
对于几何光学中的许许多多的定律,费马找到了一种统一的描述,现在被称为费马原理,被认为是最小作用量原理在几何光学中的特例,是最小作用量原理最早的成功例子。上一篇文章并没有真正写最小作用量原理,写的仅仅是一些简单的极值问题(千万不要认为那就是最小作用量原理),而本文与下一篇文章则将写最小作用量原理在几何光学与动力学的特例,并给出比较精确的数学公式(这是为了后面的横向比较和更深刻地理解最小作用量原理),对微积分头痛的人可以跳过公式只看文字。费马原理是这么说的:过空间中两定点的光,实际路径总是光程最短、最长或恒定值的路径。其中光程定义为该介质的折射率乘以路程。写成数学的形式就是:其中,δ是变分符号,p1、p2表示空间中两个固定点,n为介质的折射率,s表示路程。为了理解上式的含义,我们需要和导数做一个类比。我们对一个函数求导数,如果导数值等于零,那么可以判断出原函数在该点处会取得极小值、极大值或恒定值。上面的式子和导数有一个显著的不同,导数研究的是以字母为自变量的函数的极值,而上式想求的则是以一个函数(位置随时间变化的函数)为自变量的泛函的极值。我们把每一条路径看作是位置随时间变化的函数,把这个函数看作自变量,我们要求的则是各条路径中光程取极值的那条路径;就像我们求导求的是各个x中使得y取极值的那个点。函数求极值可以用导数,泛函求极值则可以用变分法,即δS=0(其中S是一个泛函)。大家就把δ理解成和导数相类似的东西就可以了。大家可能还见过费马原理的另一种表述:过空间中两定点的光,实际路径总是时间最短、最长或恒定值的路径。就是把光程换成时间t了,即:
这两种表述是等价的,因为
上面推导中v表示光在某介质中的传播速度(v=c/n),c表示真空中光速(是个常数),其余字母的解释和前面一样。
在几何光学中,我们把作用量S定义为
也就是说作用量在几何光学中的形式就是等号右边的那部分。
有了费马原理,就有了全部几何光学,我们可以从费马原理出发退出所有的几何光学定理。这是费马原理的强大威力之一。首先看最简单的,光在同种均匀介质中沿直线传播,从费马原理当然一眼就能推出来。光走其他的路径肯定比直线所花的时间要长(暂不讨论广义相对论中的时空弯曲)。
再来证明平面镜反射中反射角等于入射角。我们把S点对称到平面镜的另一边,用直线联结S’与P,得到的就是时间最短的路径,联结SO,通过简单的平面几何知识就可以得到反射角等于入射角的结论。
折射定律亦可以从费马原理推出来,但是稍显麻烦,在这里就不定量讨论了。我想说的是光之所以发生折射确实是因为光走那条关了一道弯的路径是时间最短的。记得很小的时候我就知道光可以发生折射,可是我就一直弄不明白好端端的直线光为什么不走,非要走一条怪异的拐弯的路线。我曾经问过很多老师光为什么会发生折射,他们都没有给我满意的答复,直到我看见了费马原理才彻底弄明白了这个问题。
下面我要重点说一下费马原理如何简洁的证明圆锥曲线的光学性质。这里的圆锥曲线都被镀上了一层银,可以当镜子用。
(1)从椭圆一个焦点发出的光,经过椭圆的反射,会汇集到另一个焦点上。证明:根据椭圆的定义,F1P+PF2=定值,根据费马原理,光的实际路径是光程极小、极大或定值的路径,所以F1到圆锥曲线上任意一点再到F2是光走的实际路径,所以从F1发出的光经过圆锥曲线反射会汇集到F2。
(2)从抛物线的焦点发出的光,经过抛物线反射会形成平行光束。证明:做出抛物线的准线,F1P等于P到准线的距离,即这两段光程相等。光的实际路径至于光程的取值有关,所以从F1发出的经过抛物线反射的光和直接从准线向右发出的光完全等效,因此从F1发出的光,经过抛物线反射会形成平行光束。
(3)从双曲线的一个焦点发出的经过双曲线反射形成的光,好像是从双曲线的另一个焦点直接发出的。证明:因为F1P-F2P=定值,所以对极值的取得没有影响,即从F2发出的经过P反射的光与从F1直接发出的经过P的光取极值的路径相同,即路径是一样的。故证明了双曲线的光学性质。
要知道,从数学上证明上述性质是相当麻烦的,而有了费马原理则可以几句话就把问题解决,一点高深的数学也没用。这是费马原理的另一个强大威力。
至于费马原理为什么是对的,《费恩曼物理学讲义 第二卷》第19章给出了一个精彩阐述。他是这么说的:“要是他遵循一条需要不同时间的路径,则当它到达时就有不同相位。而在某一点上的总振幅等于光能到达的所有不同路径振幅贡献的总和。所有那些提供相位差异很大的路径将不会合成任何东西。但如果你能找出一整序列路径,他们都具有几乎相同的相位,则小小的贡献便将加在一起而在到达之处得到一个可观测的总振幅。因此,重要路径就成为许多能给出相同相位彼此靠近的路径。”而只有时间取极值的那条路径,才能保证路径有微小变化时时间保持不变(再次与导数类比,函数取极值的那个点,当x有微小变化Δx时,Δy=Δx*y’=0,其余的点Δy都是一个不为0的数)。因此,时间取极值的路径被叠加了,成为了实际路径,而其余的任何可能路径都被不同的相位给抵消没了。
这个甚至可以解释光的衍射现象。当我们用一个很细的狭缝来挡住一部分光时,时间不取极值的某些路径也因为有一部分光被挡住而不能很好的叠加为零,因此这种情况下光并不是总衍直线传播,而是产生了光可以绕到障碍物后面的的现象,即衍射现象。
我们已经看到了最小作用量原理在光学中的应用,它可以代替所有其他几何光学定律。下篇文章我将写最小作用量原理在力学中的特例,以及如何代替整个牛顿力学。
最小作用量原理与物理之美4——力学
就像最小作用量原理可以推导出所有几何光学定律一样,力学中也存在一个最小作用量原理的特例可以推导出整个牛顿力学。今天我们就来研究研究这个。有这样一个事实:假定有一个质点在引力场中通过自由运动从某处移动至另一处——你把它抛出去,他就会上升又落下。如果画出x-t图(为了简化,只考虑一维的运动,设x轴是竖直的轴),那么运动图像是一条抛物线。你可以尝试着通过起点和终点画一些别的曲线,如果计算出经历整条路径期间动能减重力势能对时间的积分,你会发现所获得的数值比实际运动所获得的要大。如果我们设作用量S为
那么上面的事实换句话说就是作用量S在实际运动中取得最小值。对上面字母的解释:t1、t2表示运动的起点和终点时刻,1/2*m*v^2是研究物体的动能,V(x)是其势能(这里把它写成是随x变化的函数)。当物体只受重力的时候,V(x)=mgx。我们在上一篇文章中说过,一个泛函取得极值可以令其变分等于0,所以在力学中,最小作用量原理的特例就写作:
我们可以先定性的理解实际情况确实作用量最小。X增大时势能是增大的,作用量中势能前有个负号,所以应该在x比较大的时候多呆一段时间,而x比较小的地方尽可能快地往上爬,以保证动能减势能之差对时间累积之后尽可能小。
下面我想用基本的微积分变一个惊人的魔术:从最小作用量原理推导出牛顿第二定律F=ma!
我没完整学过变分法,因此我将主要根据《费恩曼物理学讲义 第二卷》第19章的内容,不直接用变分法而用高中生就能接受的初等的微积分来推导。
我们现在想要求的是一个泛函S的极值[之所以说S是泛函是因为,S的自变量是x随时间变化这个函数x(t)],可以类比当初学导数的过程。先回忆一下我们还没学求导公式的时候是怎么求导的:要求一个函数的极值,我们可以令x有一个无穷小的变化Δx,代入函数的表达之后运算并舍掉高阶无穷小量最后算出Δy,令导数等于Δy/Δx等于0即可求得y在何时取得极值。我们将模仿上述过程求泛函S的极值。
先进行一些前期工作。首先把v换掉,根据v是x对t的导数得到
在下面的推导中,为了方便有时把x(t)简写作x。我们称真实路径为x0(t),而x(t)则表示某条假想的尝试路径。我们设真实路径与实际路径有一微小差别(当作小量)记作η(t)。同样为了方便有时把η(t)简写作η。因为我们的数学模型规定了p1、p2是空间中两个固定点,因此有η(t1)=0,η(t2)=0(这个规定是必须的,否则得不到任何有价值的东西)。
有了上面这些东西,我们开始对S进行运算。
忽略掉高阶无穷小,即含有η^2或更高次幂的项,得到
下面对V(x0+η)变形,如果知道泰勒级数的人可以容易的理解V(x0+η)如何展开,如果不知道的话也不要紧,类比导数(类比导数是多么重要啊!!!)。
我们知道y可以写作y=y0+Δy=y0+y’*Δx,其中y表示y对x的导数。那个η和Δx地位是相当的,V(x)和y地位是相当的,类比着我们可以写出
其中V’表示V的导数。所以
还记得δS的定义吧,它就是我们的尝试路径得到的S减去实际路径得到的S0。所以
现在的问题是,这里是某个积分,虽然我们还不知道x0是什么,但是我确实知道不管η是什么,这一积分必须恒为零。
我们需要做的是把积分号里面那
No comments:
Post a Comment