本系列第一弹介绍的是作用量,不过值得指出的是,无论是国内还是国外,一般力学教材往往先介绍拉格朗日函数,然后才是作用量。以笔者浅见这是因为学分析力学之前,学生们会先学微积分,所以是这个顺序。而考虑到微分比积分要更易懂一些,所以本科普拟从作用量出发,通过微分引出拉格朗日函数。
微积分的基本思想在前面的贴子里已经介绍过了,我们先给出对拉格朗日函数的一个概述:拉格朗日函数,就是作用量对参量的微分。
什么叫“作用量对参量的微分”?乍一看你或许会觉得一头雾水,不过我换个说法你就明白了:拉格朗日函数,就是单位过程内作用量的积累量。
这种描述就很熟悉了,你要还觉得迷惑,那我用这么个定义提醒你:有道是,速度是单位时间内位置的变化量,有道是,密度是单位体积内的质量。
这下,你该懂了吧?
但是既然如此,我为什么要给出第一种表述呢?这牵涉到之前所说的微分的问题,不过微分问题解释起来也很容易。那就是,你还记得高中物理对“瞬时速度”的定义吗?中学教材里往往会这么教你:考察某点A或者某时刻t的瞬时速度,可以在其周围截取一小段运动,根据小学数学里就学过的“位移/时间=速度”,便可以定义出这一小段的平均速度。然后,当我们把截取的小段无限缩小,最后搞出个无限接近零的一段位移除以这段位移所对应的无限接近零的一段时间,这就是瞬时速度。这实际上是微积分的基本思想之一,我们现在的数学书里经常使用的是柯西的那一套,什么任意小啊什么总存在怎么怎么样啊……但实际上,对于不是数学系的人而言,这些都是吓唬人的,完全没必要这么刻板,只要你有点想象力,我告诉你五个字“无限接近零”你肯定就理解得八九不离十了。
回到正题,关于拉格朗日函数,你完全可以仿照瞬时速度的定义去理解,只不过速度是随着时间积累位移,而拉格朗日函数则是随着过程积累作用量而已。拉格朗日函数比较抽象,也比较广泛,尽管到现在已经说你使用瞬时速度的概念去理解就行了,但你八成还会问,“单位过程”是什么?实际上这个概念并不可怕。第一贴讲作用量的时候就讲过,作用量这种东西其实无处不在,不同问题里可以是不同的量,同样所谓的“过程”在不同问题里也可以有各种各样的形态。上面举的都是以时间衡量过程的例子,而实际上过程参量视问题可以变化,例如投资做生意,当你试图用最少的投资获得最多的利润时,这时你的过程参量就是你投的资金了,而作用量则可视作你获得的利润,而拉格朗日函数便是你的利润随着投资而增长的这么一个比率。
不过话说回来,对于物理问题,我们往往还是把时间当做衡量过程进行的进度的量,所以在力学问题中,拉格朗日函数一般依然是对时间而言的,结合第一帖中对微积分的介绍,于是就有这个公式:
S=∫Ldt
L就是拉格朗日函数,t则是时间。这个式子的意思就是,作用量是拉格朗日函数随着时间积累起来的,就像位移是速度随着时间积累出来的结果一样。进一步讲,第一贴里贴出过作用量的另一表达式S=∫(pdx-Edt),两相对比,我们还可以得出:
L=pv-E
由于速度v=dx/dt(有了前面对瞬时速度的定义,这个表达式对你来说已经无压力了吧?),所以拉格朗日函数L在力学上就是这么个玩意,再进一步使用p=mv、E=T+V(T是动能,V是势能)、T=mv^2/2这些耳熟能详的公式,还可以把拉格朗日函数化成这个形式:
L=T-V
这样,力学教材里那些概念性的东西,对你来说大致就没什么陌生的了。数学说完了,最后再用大白话重新解释一遍:拉格朗日函数就是作用量在微积分的框架下导出的一个“率”,也就是作用量随着过程的进行而积累的“积累率”。值得说明的一点是,对于绝大多数问题(不止是物理问题)而言,最小作用量原理一旦成立就是普适的,意思是你随便摘出一段过程来都要满足这个原理,无论你把过程的起始点和终点放在哪都满足所谓的“δS=0”,在这种条件下不难理解,δS=0和δL=0是等价的,任意一段过程中作用量无一例外的取最低,这意味着拉格朗日函数同样要处处取最低,有一个比较幽默的例子可以助你理解:考场上,如果你考了个最高分也就是满分,那你每一题都必然是满分,如果你得了个最低分也就是鸭蛋,那你每一题都必然是零分。反过来讲一样成立,如果你每一题都得满分,整张卷子必然是满分,如果每一题都零分,最后整张卷子也必然是鸭蛋。不过当然你也可以看出来,只有对于满分和零分这种极端分数,这逻辑才能成立,但是作用量本来就是以“最”字看家的,所以这对它来说是一个必然。
微积分的基本思想在前面的贴子里已经介绍过了,我们先给出对拉格朗日函数的一个概述:拉格朗日函数,就是作用量对参量的微分。
什么叫“作用量对参量的微分”?乍一看你或许会觉得一头雾水,不过我换个说法你就明白了:拉格朗日函数,就是单位过程内作用量的积累量。
这种描述就很熟悉了,你要还觉得迷惑,那我用这么个定义提醒你:有道是,速度是单位时间内位置的变化量,有道是,密度是单位体积内的质量。
这下,你该懂了吧?
但是既然如此,我为什么要给出第一种表述呢?这牵涉到之前所说的微分的问题,不过微分问题解释起来也很容易。那就是,你还记得高中物理对“瞬时速度”的定义吗?中学教材里往往会这么教你:考察某点A或者某时刻t的瞬时速度,可以在其周围截取一小段运动,根据小学数学里就学过的“位移/时间=速度”,便可以定义出这一小段的平均速度。然后,当我们把截取的小段无限缩小,最后搞出个无限接近零的一段位移除以这段位移所对应的无限接近零的一段时间,这就是瞬时速度。这实际上是微积分的基本思想之一,我们现在的数学书里经常使用的是柯西的那一套,什么任意小啊什么总存在怎么怎么样啊……但实际上,对于不是数学系的人而言,这些都是吓唬人的,完全没必要这么刻板,只要你有点想象力,我告诉你五个字“无限接近零”你肯定就理解得八九不离十了。
回到正题,关于拉格朗日函数,你完全可以仿照瞬时速度的定义去理解,只不过速度是随着时间积累位移,而拉格朗日函数则是随着过程积累作用量而已。拉格朗日函数比较抽象,也比较广泛,尽管到现在已经说你使用瞬时速度的概念去理解就行了,但你八成还会问,“单位过程”是什么?实际上这个概念并不可怕。第一贴讲作用量的时候就讲过,作用量这种东西其实无处不在,不同问题里可以是不同的量,同样所谓的“过程”在不同问题里也可以有各种各样的形态。上面举的都是以时间衡量过程的例子,而实际上过程参量视问题可以变化,例如投资做生意,当你试图用最少的投资获得最多的利润时,这时你的过程参量就是你投的资金了,而作用量则可视作你获得的利润,而拉格朗日函数便是你的利润随着投资而增长的这么一个比率。
不过话说回来,对于物理问题,我们往往还是把时间当做衡量过程进行的进度的量,所以在力学问题中,拉格朗日函数一般依然是对时间而言的,结合第一帖中对微积分的介绍,于是就有这个公式:
S=∫Ldt
L就是拉格朗日函数,t则是时间。这个式子的意思就是,作用量是拉格朗日函数随着时间积累起来的,就像位移是速度随着时间积累出来的结果一样。进一步讲,第一贴里贴出过作用量的另一表达式S=∫(pdx-Edt),两相对比,我们还可以得出:
L=pv-E
由于速度v=dx/dt(有了前面对瞬时速度的定义,这个表达式对你来说已经无压力了吧?),所以拉格朗日函数L在力学上就是这么个玩意,再进一步使用p=mv、E=T+V(T是动能,V是势能)、T=mv^2/2这些耳熟能详的公式,还可以把拉格朗日函数化成这个形式:
L=T-V
这样,力学教材里那些概念性的东西,对你来说大致就没什么陌生的了。数学说完了,最后再用大白话重新解释一遍:拉格朗日函数就是作用量在微积分的框架下导出的一个“率”,也就是作用量随着过程的进行而积累的“积累率”。值得说明的一点是,对于绝大多数问题(不止是物理问题)而言,最小作用量原理一旦成立就是普适的,意思是你随便摘出一段过程来都要满足这个原理,无论你把过程的起始点和终点放在哪都满足所谓的“δS=0”,在这种条件下不难理解,δS=0和δL=0是等价的,任意一段过程中作用量无一例外的取最低,这意味着拉格朗日函数同样要处处取最低,有一个比较幽默的例子可以助你理解:考场上,如果你考了个最高分也就是满分,那你每一题都必然是满分,如果你得了个最低分也就是鸭蛋,那你每一题都必然是零分。反过来讲一样成立,如果你每一题都得满分,整张卷子必然是满分,如果每一题都零分,最后整张卷子也必然是鸭蛋。不过当然你也可以看出来,只有对于满分和零分这种极端分数,这逻辑才能成立,但是作用量本来就是以“最”字看家的,所以这对它来说是一个必然。
- 坂上中微子 : 回复 品淼斋主 :这里有个概念性的讨论:http://tieba.baidu.com/p/1056665326?pid=11992800865&cid=0#11992800865
小问题:经典质点力学中的作用量,究竟是几个自变...
大丈夫,没问题~~
既然写出了H,也就是真实轨迹的运动了(满足拉格朗日方程)。。因此q和dq/dt也就不是独立的变量了。。。
顺带一提,朗道的《力学》中就是这么处理,而得出\partial S/\partial t = -H的。。
既然写出了H,也就是真实轨迹的运动了(满足拉格朗日方程)。。因此q和dq/dt也就不是独立的变量了。。。
顺带一提,朗道的《力学》中就是这么处理,而得出\partial S/\partial t = -H的。。
我个人认为S=∫Ldt和S=S(p,q,t)只是在轨迹为真实轨迹时的值相等。从来源上来说实际上有一些区别,S=∫Ldt是最小作用量原理里面的泛函,而S=S(p,q,t)实际上是正则变换的母函数,二者在q=q(t)及p=p(t)取真实轨迹时相等。
泛函的定义不就是向量空间到数域的映射么。。。作用量就是\int L dt,是L到数域的一个映射。。泛函是不管怎么回避不掉的。。。
不过我感觉和这个问题没什么太大关系。。。
如果是一个物体的真实轨迹的作用量(满足拉格朗日方程),那么就可以将他看成坐标和时间的函数,全微分之后会有两个大项, 一项是坐标的微分,一项是时间的微分。。
坐标的微分是S的梯度,也就是动量。对时间的偏导得到的是负的哈密顿函数。。
不过我感觉和这个问题没什么太大关系。。。
如果是一个物体的真实轨迹的作用量(满足拉格朗日方程),那么就可以将他看成坐标和时间的函数,全微分之后会有两个大项, 一项是坐标的微分,一项是时间的微分。。
坐标的微分是S的梯度,也就是动量。对时间的偏导得到的是负的哈密顿函数。。
回复:11楼
不一定。。。假如轨迹确定了,是(0,0)到(1,1)的一条直线。。。
但是这上面完全没有时间的事情。。。物体可以花5秒钟过,也可以1秒中,可以匀速,也可以非匀速。。。时间仍然是另一个变量。。。
不一定。。。假如轨迹确定了,是(0,0)到(1,1)的一条直线。。。
但是这上面完全没有时间的事情。。。物体可以花5秒钟过,也可以1秒中,可以匀速,也可以非匀速。。。时间仍然是另一个变量。。。
回复:4楼
也许PIPI老师的意思是,一旦完成变分问题的求解,就可以求出实际运动过程的作用量泛函值。不过,个人觉得那个实际作用量值作为泛函的极值(严格说是驻定值)没有任何力学价值;况且,在路径积分量子化时,涉及各种路径传播的贡献,最终有意义的还是作为泛函的作用量。
也许PIPI老师的意思是,一旦完成变分问题的求解,就可以求出实际运动过程的作用量泛函值。不过,个人觉得那个实际作用量值作为泛函的极值(严格说是驻定值)没有任何力学价值;况且,在路径积分量子化时,涉及各种路径传播的贡献,最终有意义的还是作为泛函的作用量。
No comments:
Post a Comment