Hamilton
方程
力学定律的
Lagrange形式假定系统的力学状态是由它的广义坐标和广义速度确定的,数学上它表现为力学体系的“状态函数” ——Lagrange量——是坐标和速度的函数,(,,)LLqqt=。对力学体系的这种描述并非唯一的,我们完全可以用别的变量来确定体系的力学状态,这一章介绍的Hamilton理论就是这样一个例子,Hamilton理论是用广义坐标和广义动量对体系进行描述的。这种方法并不会为我们添加什么新的物理内容,而且就整体来说,这种方法对力学问题的直接求解并不比Lagrange方法有什么优势,实际上,前者的过程一般来说反而要繁琐很多。Hamilton理论的独特之处在于,广义坐标(位置坐标)和广义动量(动量坐标)具有同等的地位,它们满足的方程在形式上是对称的,这种对称性正是它在物理学其它领域(例如量子力学和统计力学)得到广泛应用的理论基础,换句话说,Hamilton理论的重要性在于为我们提供一个框架,一个可以使我们更好地理解和研究各种力学普遍问题的框架,也是一个在许多物理学领域做理论推广的框架,这种框架对于理解从经典力学到量子力学的过渡是特别重要的。
一般来说,描述体系的变量不同,体系的状态函数也会不一样。最典型的例子是对热力学平衡态的描述,如果采用熵和体积
V作为变量(所谓状态参量,类似于Lagrange力学中的坐标和速度),那么状态函数是内能S(),USV,我们知道dU;但是你完全可以用别的变量来描述这同一个体系,例如温度T和体积V,这时候状态函数也相应地变为Helmholtz自由能TdSPdV=−(), =,它的全微分dfSdT 。因此,为了用和iqip描述力学体系,我们首要的任务就是找出这个新的状态函数。()()()( ,, ,, ,, ,,
?
第 1 页,共 14 页
我将用一个数学例子向你解释“同一个对象可以有不同的等价描述究竟是什么意思?”以及“这些不同的描述在数学上有什么样的关系?”
我们考察一个圆,几何上它是由平面上到原点的长度等于
1的一系列点构成的,但是我们也有别的办法得到这个圆,作为第一步,你可以用一个切正方形近似它,当然这种近似是非常粗糙的,而切八边形则是一个更好的近似,我想你很容易明白,当多边形的边数越来越大时,这种近似将越来越精确,实际上,当多边形的边数趋于无穷大时的极限情况就是我们所要的圆。因此,我们看到,几何上,你可以将圆看作是到固定点有相同长度的点构成的,也可以看作是一系列直线(圆的切线)的包络线。究其原因在于,我们总可以用与曲线相切于某点的一段直线段作为在这一点附近的那一部分曲线的近似。如果我们作出曲线上相邻两点AABC B的切线,它们相交于譬如说C,那么,当A和B距很近时,我们就可以用相ACCB两个直线段来近似和A B间的那段曲线,这两个点靠的越近,这种近似也就越精确。所以,对于任何一条曲线,其在所有点上的切线的包络线——对于圆来说,那就是那个极限情况下的多边形——就是曲线本身。因此,我们就可以有两个等价的方法来描述(或确定,或定义)曲线:要么告诉我构成它的一系列点(,x)y 么告诉我一系列的切线。
现在我们来看一下代数上对于这两方法是如何描述的。对于第一种观点,我
第 2 页,共 14 页
们通常是用函数
()yfx=来确定曲线上的点(,)xy的; 而对于第二种观点,我们就需要用一些数来给出它的所有切线。一条直线可以用两个数来描述:斜率和截距。为了能用一个(单值)函数——譬如说我们将截距看作是斜率的函数——同时给出所有的切线,就要求两条切线不能有相同的斜率——一个斜率只能对应唯一的截距,这相当于要求()fx′′总是大于零(或者总是小于零)的,因为这种情况下曲线切线的斜率就是单调增加(或减小)的。[实际上,由于我考虑的是那些光滑的函数()fx,也就是说()fx′′是连续的,因此,它不可能从负值一下子跳到正值,反之亦然。所以上面的条件可以简单地说成是要求f的2阶导数()fx′′在任何一点x处都不等于零,在这种情形下,()fx′′要么总是大于零,要么总是小于零]。现在我们就来看一下如何将截距表示为斜率的函数。假设0x 曲线上任意一点,曲线在0x点的切线方程就可以表示为y这里我用0u表示切线的斜率,也就是曲线在00 x 的斜率0()f ′而−示切线的截距。g以由“该切线经过曲线上的点0g0 v (0,)g− 0x
()
yfx= y()yfx=
第 3 页,共 14 页
00
(,())xfx”得到:。在我们的条件下,对于每一个0000()gxufx=−0x就对应一个斜率,进而又对应唯一一个截距(应该说是截距的负值,这只是一个习惯),也就是说,截距是斜率的一个函数。因此,我们将下标去掉,这个函数就可以写为0u0g0 ()()guxufx=− (1)
知道了这个函数,也就知道了曲线的所有切线,从而也就知道曲线本身(包络线)。你注意到
()gu的表达式还有变量x,对此应该这样理解:你需要通过uf=∂∂ 的反变换把x用表示出来,u()xxu=,并把它代入上式,这样形式上也就只是的函数了[条件gu()0fx′′>保证了反变换的存在]。换一个角度,对上式做全微分,你就可以看到用这种方式构造的确实不再把gx作为变量了dfdgudxxdudfudxxdudxxdudx=+−+− (2)
这里
xdgdu=,它实际上就是uf =∂∂的反变换。
因此,几何上,对于同一曲线
()fx,我既可以用一系列的点(,)xy来描述[其中()yfx=],也可以等价地用另外一系列的点(,来描述 [其中)uv()vgu=]。代数上,我既可以用函数()fx,也可以用函数()gu来描述这同一条曲线,数学上把类似从()fx到()gu的这种变换称为Legendre变换。上面的例子中我们通过Legendre变换把函数()fx变为函数()gu: ()() dffxguudx⇒其中 (3)
这里
()gu是这样定义的()()guxufx=−(4)
顺便提一句,
()0fx′′>必然导致()0gu′′>(想想为什么?),因此我们对
第 4 页,共 14 页
()
gu也可以做Legendre变换,由于xdgdu=,因此()gu的Legendre变换为()xugu−,它就是原来的函数()fx。
举个例子。考虑函数
2()fxx=,它满足我们前面的条件20f′′=>,新变量()2ufx′== ,其反变换为2xu=;Legendre变换后新的函数为222()()244guxufxuuu=−−。而2xguu=∂∂=正是的反变换。如果你有兴趣,不妨以每一个u作为斜率,相应的2u= ()gu−作为截距做出一系列的直线,你会发现这些直线的包络线正是曲线2()fxx=。
稍微推广一下,考虑这样一个具有两个自变量的函数
(,)fxy,现在假如我只想把其中一个变量(譬如,假设y220fy∂∂>)变为uf =∂∂,而另一个变量保持不变()(), , ffxygxuuy∂⇒ ∂其中 (5)
这时候,
(,)gxu就可由如下Legendre变换得到()(),gxuyufxy =−(6)
提醒你注意一下它的形式:第一项是需要变换的自变量和将要变换成的自变量
yuf=∂∂ 的乘积,然后减去原来的函数。你需要通过uf =∂∂的反变换把用yx和表示出来,u(,)yyxu=[同样的,条件220fy∂∂>保证了反变换的存在],并把它代入上式,这样形式上就是gx和u的函数了。对上式做全微分,我们也可以看到用这种方式构造的不再把作为变量了gy ffdgyduudydfyduudydxdyxyfydudxx∂∂=+−+−−∂∂∂=−∂ (7)
值得注意的是,从这个全微分不难看出:做变换的自变量
yg =∂∂(它实际
第 5 页,共 14 页
上就是
uf=∂∂ 的反变换),也就是说
新的函数对新的自变量之偏导数等于旧的自变量
而对于保持不变的自变量则有
gxfx∂∂=−∂∂,也就是说
新、旧函数对不做变化的自变量的偏导数相差一个负号
。
不难把
Legendre变换推广到更一般的情形,我把它作为练习留给你。
现在我们可以回答前面的问题了,也就是说,当描述力学体系状态的自变量由和变为和
iqiqiqi pLq=∂∂时,新的状态函数具有什么样的形式?这时候条件220fy∂∂>变为了221112221det0sijssLqqLqqLqqLqqLqq∂∂∂∂∂∂⎛⎞∂=>⎜⎟⎜⎟∂∂⎝⎠∂∂∂∂∂∂(8)
在势能不依赖于速度的情况下,由于动能的正定性这个条件是必然成立的。
[实际上,对于势能线性地依赖于速度的情形——譬如带电粒子在电磁场中的运动——这一条件也是必然成立。]
根据前面的讨论,新的状态函数应该等于:作变换的自变量乘以变换后的自变量
iqi pLq=∂∂,对所有这样的项求和再减去原来的函数,它就是L (),,iiiL HqptqLqpLq∂=−−∂(9)
我们将这个函数称为
Hamilton函数或者Hamiltonian(Hamilton量)。实际上这个式子中间的那一项大家是熟悉的了,它就是我们以前定义的Jacobi积分。但是需要强调的是,Jacobi积分是和的函数;而Hamilton函数则是广义坐标和iqiqiqip的函数,也就是说,我们需要把上式右边的通过iqi pLq=∂∂的反变换用和iqip表示出来,。尽管Jacobi积分和Hamilton函数在数值上不会有任何差别,但是为了强调自变量(或函数行为)的不同,我们用了不同的术语称呼它们。当谈到Hamiltonian时,它总是广义坐标和广义动量的函数(当(,)iiqqqp=第 6 页,共 14 页
然,也可能显含时间)。
根据前面的讨论,新的状态函数
H对新的自变量ip之偏导数等于旧的自变量: iqiiHqp∂=∂(10)
而新、旧状态函数对不作变化的自变量的偏导数相差一个符号(不难看出这一点对也是成立的),也就是说
iqt , iiHLHqqt∂∂∂=−−∂∂∂ (11)
利用
Lagrange方程以及ip的定义,i pLq=∂∂,上面的第一个式子可以写为iiiiHLdLpqqdtq∂∂∂=−−−∂∂∂(12)
方程
() 1,2,,iiiiHqpisHpq∂⎧⎪∂⎪⎨∂⎪−⎪∂⎩(13)
称为
Hamilton方程,它们组成2s个未知函数()iqt和()ipt的2s个一阶微分方程的方程组,其地位与s个Lagrange二阶方程相当。由于Hamilton方程具有简单而近乎对称的形式(实际上后面我们可以将它写成关于和iqip完全对称的形式),这些方程也称为正则方程。而和iqip则称为正则变量。
方程
(11)中第一个等式告诉我们:如果不出现在Lagrange函数中,那么它也不会明显此出现在Hamiltonian中(我们把这样的坐标称为循环坐标),因此由正则方程知道与其共轭的广义动量守恒(必然如此,从Lagrange力学到Hamilton力学我们只是换了一组变量描述体系而已,它不会改变体系的力学规律。如果说有什么不同的话,那就是利用Hamilton方法看出这一点来要稍微容iqiq
第 7 页,共 14 页
易一点。)
方程
(11)中第二个等式的含义是:如果不显含时间,那么LH也不会显含时间。而以前在守恒定理中我们已经知道,如果不显含时间,那么Jacobi积分从而Hamilton函数是运动常数。这一点也可从Hamiltonian对时间的全微商看出,因为L iiiidHHHHqpdtqpt∂∂∂=++∂∂∂(14)
如果把和
iqip用正则方程(13)代入上式的话,前面两项相互抵消,因此dHHdtt∂=∂ (15)
即
Hamiltonian对时间的全导数和偏导数是相等的。因此,如果Hamiltonian不明显地依赖于时间,那么0dHdt=,也就是说Hamiltonian是守恒的,const.H=。在上一章讲到能量守恒定理时,我们看到,如果势能不依赖于速度并且笛卡尔坐标与广义坐标之间的变换方程不显含时间的话,Hamiltonian等于体系的总能量,HE=。因此,在这些条件下,并且如果H不显含时间的话(0Ht∂∂=),那么const.HE==。再次强调一下,Hamiltonian是否等于体系总能量与能量是否守恒这是两个完全不同的问题。比如这里,如果0Ht∂∂≠,那么它只说明Hamiltonian不守恒,而是不一定等于EH的;同样的道理,HE=并不意味着总能量是守恒的,因为Ht∂∂可能并不等于零。
除了动力学的变量、或、外,
Lagrange函数和Hamilton函数还可能包含各种参数,这些参数可能是描述体系本身的性质,也可能是作用在体系上外场的特性(譬如qqqpU α=中的α)。假定λ是这样一个参量,即(,,,)LLqqtλ=,由于我们对λ是不作变换的,因此类似于和t必然有iq ,,,,pqtqqtHLλλ∂∂⎛⎞⎛⎞−⎜⎟⎜⎟∂∂⎝⎠⎝⎠(16)
第 8 页,共 14 页
这个式子把
Lagrange函数和Hamilton函数对参数λ的导数联系了起来。导数下标表示这些量在微分时是保持不变的(当然,偏导数本身就包含了这样的含义,这里我把下标明显地写出来只不过是想强调一下它的含义而已)。
举一个例子,考虑粒子在重力场中的运动,体系的
Lagrange函数为212LTUmxmgx=−−(17)
广义动量为
xpLxmx=∂∂=,反变换为xxpm=。因此Hamilton函数为22222xxxxpppHxpLmgxmgxmmm⎛⎞−−−+⎜⎟⎝⎠(18)
写出正则方程
, xxxpHHxppmx∂∂===−−∂∂(19)
第一个方程是我们已经得到过的广义动量定义式的反变换,第二个方程才是重要的。利用第一个方程求出
xpmx=,并代入第二个方程得到mxmg=−(20)
显然这是正确的结果。从这个简单的例子我们可以看出用
Hamilton方法求解问题的一般过程:○1写出Lagrange函数(),,Lqqt;○2利用定义写出广义动量i pLq=∂∂,利用反变将写成正则变量的函数iq(),,iiqqqpt=;○3将此式代入(),,iiqpLqqt−得到体系的Hamilton函数(),,HHqpt=;○4写出正则方程;○5然后求解这2s一个阶微分方程。一般需要把它们变为s个2阶微分方程后再求解。而这s个2阶微分方程本可以从○1直接由Lagrange方程得到。即便我们有可能把Hamilton方法的过程适当简化,但是比起Lagrange方法来它还是过于繁琐了。Hamilton方法的优势本不在求解具体力学问题上!
刚才我说到有可能对
Hamilton方法的过程适当简化,比如上面的例子中,由于这是粒子在稳定外场中的运动,因此,Hamilton函数等于体系的总能量(变换方程显然不显含时间,因为我采用的就是笛卡尔坐标),因此你可以不写出
第 9 页,共 14 页
Hamilton
函数的定义式,而直接将xxpm=代入HTU=+得到它。类似的,对于中心势场中运动的粒子,它的Hamilton函数为HTU=+ (21)
在笛卡尔坐标系中
(), 2iiiiiippHUxxpm=+=(22)
[
当你把这里的广义动量ip和Hamilton量H用量子力学中的微分算符ˆˆ kkpiHixt∂∂=−∂∂(23)
代替时,就得到了相应的
Schrödinger方程222itm ψψ⎛⎞∂=−∇+⎜∂⎝⎠(24)
这里
ψ就是我以前提到过的几率幅(量子力学中称其为波函数)。]
在球坐标中
()2222221112sinrHpppUmrrθϕθ⎛⎞+++⎜⎝⎠(25)
其中
22, , sinrpmrpmrpmrθϕθϕ===(26)
再举一个一维简谐振子的例子。
Lagrange函数为21122LTUmxmxω=−−(27)
广义动量
xxpLpmxxxm∂==⇒=∂(28)
由于
Hamilton函数等于体系的总能量,因此222122xpHTUmxmω=+=+ (29)
第 10 页,共 14 页
正则方程为
2, xxxpHHxppmx ω∂∂===−−∂∂(30)
利用第一个方程求出
xpmx=,并代入第二个方程得到20xxω+=(31)
最后看一个相互作用依赖于速度的例子。带电粒子在电磁场中的
Lagrange函数为()(21122kkkkLmvqvAmxxqxAφφ=−−⋅−−(32)
广义动量为
iiiLpmxx ∂==+∂(33)
反变换
ii pqAxm−(34)
Hamilton
函数()()2222iiiiiiiiiiiipqApqApqAHxpLpqqAmmmpqAqmφφ−−−−−−−+(35)
当把正则方程化为
2阶微分方程的时候,你发现最后得到的就是我们所熟悉的[记得电磁场与规范势之间有关系:(mrqEvB=+×BA=∇×以及EAtφ=−∇−∂∂。这个问题我留做思考题请你自己完成]。
如果你仔细看一下这个
Hamilton函数的形式就会发现,第一项正是带电粒子的动能,而第二项则只与标量势有关(当电磁场不随时间变化时,它就是Coulomb势能)。因为磁场是不做功的,所以这里的Hamilton量可以看作是带电粒子的总能量,这里没有磁场什么事情。
第 11 页,共 14 页
[
当你把这里的广义动量ip(而不是通常动量)和Hamilton量imxH用量子力学中的微分算符(23)代替并把它作用于量子力学的波函数时,就得到了带电粒子在电磁场中运动的Schrödinger方程。而如果考虑相对论效应,你做类似的代替将得到量子力学Klein-Gordon方程。]
最后我想就
Hamiltonian的不确定性作一些说明。在Lagrange力学中,Lagrange函数精确到一个坐标和时间函数(,)fqt的全导数dfdt,即和LLLdfdt′=+描述的是同一个力学体系;由此我们得到,广义动量精确到对广义坐标的偏导数,也就是说,由于Lagrange函数的不确定性,对于同一个广义坐标可以对应不同的广义动量,这里iqiipLq=∂∂和iii pLqpfq′′=∂∂=+∂∂。而这必然会导致Hamiltonian的不确定性,即下面的两个Hamiltonian描述的是同一个体系: ()iiiiiiiiHqpLfdffHqpLqpLqHqdt=−⎛⎞∂∂′′′=−−−−⎜⎟∂∂⎝⎠(36)
换言之,
Hamiltonian函数可以附加任意一个坐标和时间函数(,)fqt对时间的偏导数ft∂∂。
在
Lagrange力学中我们知道,广义坐标的选择不受任何限制,能够完全确定体系位置的任意qs个变量都可以选作广义坐标。Lagrange方程的形式与这种选择无关,在此意义上,可以讲对于从坐标到任意其他独立变量的变换,Lagrange方程是不变的。新的坐标Q是q的函数,实际上我们也可以假定它们明显地依赖于时间,即考虑下面形式的变换12,,qq12,,QQ(),iiQQqt= (37)
(有时将它称为点变换)。在这样的变换下,
Lagrange方程是不变的。
在新的广义坐标下,广义动量由
第 12 页,共 14 页
kkiikii
qqLL PpQqQQ
∂∂∂∂===∂∂∂∂(38)
来定义。而相应的
Hamilton函数为()(),,,,iiHQPtQPLQQt∗=−(39)
一般来说,无论形式还是数值上它都不同于原来的
Hamilton函数(如果点变换不显含时间,那么二者数值上是相等的)。这时Hamilton方程也由原来的(,,)iiHqptqpL=−, iiiiHHqppq∂∂==−∂∂(40)
变为了
, iiiiHHQPPQ∗∗∂∂==−∂∂(41)
也就是说,在点变换下,
Hamilton方程(的形式)也是不变的(广义动量只是响应坐标变换而已,它本身不能随便变换,否则我们将得不到正则方程)。
附录:相对论情形下的Hamilton函数
假设静止质量为粒子在势场
0m(),Urt中运动,我们采用迪卡尔坐标描述粒子的位置。上一章我们曾经凑出了相对论情形下粒子的Lagrange函数。由此你不难通过Legendre变换得到其Hamilton函数。
但是,这里我将换一个角度考察这个问题,也就是说,我将假设
Hamilton函数数值上等于体系的总能量()2022, with 1mEmcUrtmvc=+=−(A1)
进而通过
Legendre变换得到相对论情形下粒子的Lagrange函数。利用
(A2)
2424220mcmcpc=+
Hamilton
函数就可以写为24220Hmcpc=++ (A3)
第 13 页,共 14 页
因此
202422220 1mvHcpvppmcpcvc∂===∂+−⇒(A4)
Lagrange
函数为()2222240002222220022222220,,11111mvmvcLrvtpvHmcUvcvcmvmcUvcvcmcvcU=⋅−−−−−−−−−−−−(A5)
顺便提一句,对于自由的粒子,
22420 Hmcpc=+ (A6)
如果你把其中的
H和ip用算符(23)代替,并将(A6)看作一个算子方程从而作用在某个标量函数ϕ上,就得到
(A7)
(222222400tcmcϕ∇−∂−这就是相对论情形下粒子的量子方程,称为Klein-Gordon方程。在高级的课程中它一般写为下面的形式
(A8)
()20 with tmϕ−≡∇−那是由于采用了一种特殊的单位制,在其中1c==(称为自然单位)。
第 14 页,共 14 页
No comments:
Post a Comment