课程信息-研究生教育-教育教学-中国科学院大学
www.gucas.ac.cn › ... › 教育教学 › 研究生教育 › 课程信息
轉為繁體網頁
轉為繁體網頁
我自己阅读的一点理解(评论: The Quantum Theory of Fields ...
book.douban.com/review/7154606/
轉為繁體網頁
轉為繁體網頁
評分:5 - 評論者:七星之城
2014年10月18日 - 我们将洛伦兹对称性导致的幺正算符做小量展开时的一阶项系数标记 ... 由三维旋转自旋为1/2的粒子是什么形状的,三维真的有转两圈才能和自己重合的形状?
这个问题是不是说明了粒子内部是更高维度的空间?
按票数排序按时间排序
14 个回答
关键词:基本群,投影表示,周期边界条件。
要完整回答这个问题,涉及到的数学概念比较多。
首先,我们描述旋转,是用”旋转群“的概念,即群SO(3)。同时感兴趣的是这个群的李代数so(3),即量子力学里的角动量代数。
群和代数提供了两个角度切入这个问题:
1. 从群的角度。
首先,如果我们把旋转操作不看作一个群作用,而是一系列无穷小操作的组合,即转一圈相当于N次旋转(180/N)°,以示与”不转“的区别。这样,一个旋转就变成了群流形上的一条线(contour),任何回到原位(群单位元)的旋转体现为群流形上的一个圈(loop)。然后我们去看被转的对象:我们做以下识别(distinguish),即两个不同的旋转操作,对于任意对象而言,必然等同的条件是,它们所代表的contour之间同伦(这一结论适用于任意群)。对于转圈,则是它们所代表的loop同伦。”不转“即一个收缩至一点的loop,那么和”不转“等同的”转圈“,就必须能够(在群流形上)收缩至一点。如果假设群的实现是可微的,那么这样的识别是逻辑上可能的最细致的识别。
量子态可以做这种识别,因为它可以有内部自由度(比如相位)。经典态无法做这么细致的识别,因为它的自由度是固定的。
问题来了:SO(3)群的拓扑性质(形状)很特殊,是一个对径认同的球体,它上面有两类不等价的loop,其中一类等价于点(”不转“),而另一类和它并不等价,而”转一圈“这个操作就属于这个非平凡的类里面。简单来说,”转一圈“这个操作无法连续得变化为”不转“的操作(你可以试一试)。
数学上,这称为”SO(3)群的基本群是”。
这有什么意义呢?当我们在量子理论中实现一个群操作时,允许这样的事情发生:
即群的表示并不完全同构于群本身。这称为投影表示。这有点像一个-orbifold。在SO(3)的情况下,这就是个-orbifold,其定轴旋转的子流形就是一个莫比乌斯带(的边界) @杨晓堃 。
2. 从代数的角度。
这个角度就比较常见了,一般的量子力学书都是这么讲的。首先,so(3)=su(2),即两个群的李代数相同。然后,我们把这个代数称为角动量代数,并且写出它的所有表示。然后我们发现有自旋1/2的表示。这样的表示对于轨道角动量不适用的原因是波函数在实空间的单值性,导致了周期边界条件;而自旋角动量适用恰恰是因为它的旋转并不对应实空间的点,所以不需要有单值性,因此可以有反周期(anti-periodic)边界条件。
当然,这造成了很多人(比如题主)的困惑。简单把它归结于“自旋是内秉性质”不是一个很有说服力的方法,因为它其实还是来自于空间旋转。
两者的联系:
拥有相同的李代数的群SO(3)和SU(2),后者有着简单拓扑,而前者恰好是后者的某种automorphism的商集,过程中改变了拓扑,而这种automorphism则成了前者的基本群。因此,前者算上投影表示就和后者完全相同了。
经 @flying zz 提醒,更好的说法是:拓扑上,SU(2)是SO(3)的universal cover,所以它们有相同的李代数但不同的拓扑,而且前者的所有表示和后者的所有投影表示完全相同。对于一般的群,应该也有如此性质。比如高维旋转群,Spin(n)就定义为SO(n)的universal cover。这就是为什么我们可以省略介绍投影表示,而直接使用群SU(2)=Spin(3)作为量子理论的旋转群,并给出多一倍的表示。 显示全部
要完整回答这个问题,涉及到的数学概念比较多。
首先,我们描述旋转,是用”旋转群“的概念,即群SO(3)。同时感兴趣的是这个群的李代数so(3),即量子力学里的角动量代数。
群和代数提供了两个角度切入这个问题:
1. 从群的角度。
首先,如果我们把旋转操作不看作一个群作用,而是一系列无穷小操作的组合,即转一圈相当于N次旋转(180/N)°,以示与”不转“的区别。这样,一个旋转就变成了群流形上的一条线(contour),任何回到原位(群单位元)的旋转体现为群流形上的一个圈(loop)。然后我们去看被转的对象:我们做以下识别(distinguish),即两个不同的旋转操作,对于任意对象而言,必然等同的条件是,它们所代表的contour之间同伦(这一结论适用于任意群)。对于转圈,则是它们所代表的loop同伦。”不转“即一个收缩至一点的loop,那么和”不转“等同的”转圈“,就必须能够(在群流形上)收缩至一点。如果假设群的实现是可微的,那么这样的识别是逻辑上可能的最细致的识别。
量子态可以做这种识别,因为它可以有内部自由度(比如相位)。经典态无法做这么细致的识别,因为它的自由度是固定的。
问题来了:SO(3)群的拓扑性质(形状)很特殊,是一个对径认同的球体,它上面有两类不等价的loop,其中一类等价于点(”不转“),而另一类和它并不等价,而”转一圈“这个操作就属于这个非平凡的类里面。简单来说,”转一圈“这个操作无法连续得变化为”不转“的操作(你可以试一试)。
数学上,这称为”SO(3)群的基本群是”。
这有什么意义呢?当我们在量子理论中实现一个群操作时,允许这样的事情发生:
即群的表示并不完全同构于群本身。这称为投影表示。这有点像一个-orbifold。在SO(3)的情况下,这就是个-orbifold,其定轴旋转的子流形就是一个莫比乌斯带(的边界) @杨晓堃 。
2. 从代数的角度。
这个角度就比较常见了,一般的量子力学书都是这么讲的。首先,so(3)=su(2),即两个群的李代数相同。然后,我们把这个代数称为角动量代数,并且写出它的所有表示。然后我们发现有自旋1/2的表示。这样的表示对于轨道角动量不适用的原因是波函数在实空间的单值性,导致了周期边界条件;而自旋角动量适用恰恰是因为它的旋转并不对应实空间的点,所以不需要有单值性,因此可以有反周期(anti-periodic)边界条件。
当然,这造成了很多人(比如题主)的困惑。简单把它归结于“自旋是内秉性质”不是一个很有说服力的方法,因为它其实还是来自于空间旋转。
两者的联系:
拥有相同的李代数的群SO(3)和SU(2),后者有着简单拓扑,而前者恰好是后者的某种automorphism的商集,过程中改变了拓扑,而这种automorphism则成了前者的基本群。因此,前者算上投影表示就和后者完全相同了。
经 @flying zz 提醒,更好的说法是:拓扑上,SU(2)是SO(3)的universal cover,所以它们有相同的李代数但不同的拓扑,而且前者的所有表示和后者的所有投影表示完全相同。对于一般的群,应该也有如此性质。比如高维旋转群,Spin(n)就定义为SO(n)的universal cover。这就是为什么我们可以省略介绍投影表示,而直接使用群SU(2)=Spin(3)作为量子理论的旋转群,并给出多一倍的表示。 显示全部
首先,自旋是内禀自由度,与外部三维实空间的角动量不同,前者对应角动量量子数为半整数,而后者则为整数。简而言之,所谓转两圈重合是指1/2自旋粒子本征态的变量θ、φ至少需要改变4π才能使波函数复原,而θ、φ就是自旋本征矢在球坐标系下的方向角,所以可以形象地描述为需要转两圈才能与自身重合。至于内部空间的维度,自旋1/2的粒子有两个本征态,任何一个态可以是二者的复系数线性叠加,二维复空间加上归一化条件,因此是三维实空间。
科幻可以随便看,科普就不要看《时间简史》了。顺便说一个例子,或许不太准确,莫比乌斯带好像也可以看成是转两圈才能回到原点。
科幻可以随便看,科普就不要看《时间简史》了。顺便说一个例子,或许不太准确,莫比乌斯带好像也可以看成是转两圈才能回到原点。
有好多从群论出发的代数理解方式。我个人比较喜欢几何一点的方式,所以,“黎曼面”是一个非常不错的概念,去理解群论中的同构同态等概念时非常有帮助。
上图是一个的黎曼面,引自wiki。这个例子非常适合于自旋1/2,对于其他的自旋,可以找到其他的黎曼面来说明。
这个奇怪的曲面,自己和自己交叉了,原因是我们需要在三维表现它。。简而言之,这个奇怪的曲面才是自旋1/2的粒子在转动时所经历的空间,这个粒子转动一圈,从黎曼面的上页转到了下页,对于粒子来说这是两个不同的地方,其性质表现得不一样是很正常的,只有转两圈才能回去。
自旋实际上是粒子的内禀自由度,我们很难从宏观角度直接体会。但是实验就是这么告诉我们的,粒子有自旋。
上图是一个的黎曼面,引自wiki。这个例子非常适合于自旋1/2,对于其他的自旋,可以找到其他的黎曼面来说明。
这个奇怪的曲面,自己和自己交叉了,原因是我们需要在三维表现它。。简而言之,这个奇怪的曲面才是自旋1/2的粒子在转动时所经历的空间,这个粒子转动一圈,从黎曼面的上页转到了下页,对于粒子来说这是两个不同的地方,其性质表现得不一样是很正常的,只有转两圈才能回去。
自旋实际上是粒子的内禀自由度,我们很难从宏观角度直接体会。但是实验就是这么告诉我们的,粒子有自旋。
要从纤维丛的角度去理解。
1. 场的时空坐标在闵科夫斯基时空中,场的取值在纤维里面。
2. 在闵科夫斯基时空中,对称性由洛伦兹群Lo描述。
3. 在物理学理论中,要保持这个对称性,即洛伦兹群的作用。所以,洛伦兹群在纤维里面,会有一个表示,这个表示就是SL(2,C)。
4. 在闵科夫斯基时空中,对于转动来说(就是我们常见的转动)由SO(3)给出。这个对称性在纤维里面,要由SU(2)来描述。两者之间有个关系,你会发现,SO(3)下,转动了\theta角度,转换到纤维里面,就变成了在SU(2)下转动了\theta/2。两者差一个1/2.
(这就是你想问的转两圈才重合的问题。实际上,是闵科夫斯基时空中转了一圈,纤维里面转了两圈。数学上,管这个叫做two-fold covering space)。
1. 场的时空坐标在闵科夫斯基时空中,场的取值在纤维里面。
2. 在闵科夫斯基时空中,对称性由洛伦兹群Lo描述。
3. 在物理学理论中,要保持这个对称性,即洛伦兹群的作用。所以,洛伦兹群在纤维里面,会有一个表示,这个表示就是SL(2,C)。
4. 在闵科夫斯基时空中,对于转动来说(就是我们常见的转动)由SO(3)给出。这个对称性在纤维里面,要由SU(2)来描述。两者之间有个关系,你会发现,SO(3)下,转动了\theta角度,转换到纤维里面,就变成了在SU(2)下转动了\theta/2。两者差一个1/2.
(这就是你想问的转两圈才重合的问题。实际上,是闵科夫斯基时空中转了一圈,纤维里面转了两圈。数学上,管这个叫做two-fold covering space)。
是不是跟高维有关系,我不清楚…但是有一点我是清楚的,题主所说的“转两圈与本身重合”表明你在用宏观的视角去理解自旋,而自旋是纯粹的量子力学概念,因此这样的理解方式是不对的。量子力学里面的自旋是没有宏观物理量与之对应的。
我记得Dirac在阐述他的方程时说过一段话,意思是他在列方程时甚至没有借鉴自旋的概念,而自旋则是求解Dirac方程自然而然得到的结果。(原话找不到了…)
还有一个,宏观的旋转会有特定的旋转轴,而自旋则与坐标系的选择没有关系,一个电子在一个分子体系中,无论你如何建立坐标系求解这个电子的方程,其自旋永远都是1/2,坐标系有可能改变的仅仅是其在极轴的分量…
量子力学半吊子,可能有不妥的地方,求轻拍…
我记得Dirac在阐述他的方程时说过一段话,意思是他在列方程时甚至没有借鉴自旋的概念,而自旋则是求解Dirac方程自然而然得到的结果。(原话找不到了…)
还有一个,宏观的旋转会有特定的旋转轴,而自旋则与坐标系的选择没有关系,一个电子在一个分子体系中,无论你如何建立坐标系求解这个电子的方程,其自旋永远都是1/2,坐标系有可能改变的仅仅是其在极轴的分量…
量子力学半吊子,可能有不妥的地方,求轻拍…
自旋为1/2的粒子是什么形状的,三维真的有转两圈才能和自己重合的形状?不一定,还有可能粒子被连在一根绸带上。如图所示(或动态 Spinor orientation entanglement animated ):
这个问题是不是说明了粒子内部是更高维度的空间?
转360度不能回到原来的位型:
转720度就可以:
动态图片: Belt trick
教学视频:http://vimeo.com/62228139 、http://vimeo.com/62143283
这根绸带看不见摸不着,唯一的作用就是你旋转粒子的时候隔硬你。
附:
Feynman 演示自旋1/2粒子的绸带论证:https://www.youtube.com/watch?v=cKzzG5DS6V8&feature=youtu.be
知乎用户 赞同
狄拉克理论,自旋是相对论效应导致的。
不要问我为什么自旋,这是人为的模型。
其实我们很无奈,语言描述来自生活,生活是经典的,上帝为什么偏偏让我们用经典的语言来描述微观世界?
经典模型能够解释上帝吗?
我不知道。
不要问我为什么自旋,这是人为的模型。
其实我们很无奈,语言描述来自生活,生活是经典的,上帝为什么偏偏让我们用经典的语言来描述微观世界?
经典模型能够解释上帝吗?
我不知道。
Schottenloher intro to conformal field theory写中心扩张那章比较初等易读,有几个具体的例子比如su2这个。
-------
我觉得谈论形状没什么意义。
在量子力学里面讨论系统的对称性其实更方便的是从无穷小的角度(数学上也就是Lie group的线性化----Lie algebra)去做计算,比如这里的旋转群SO(3),但因为是从无穷小的层面出发(local),得到的整体性质最natural的应该是没有拓扑障碍(这时就像第一个回答所说的,可以把投影表示lift为线性表示,在做lifting的时候实际上我们考虑的是SU(2)被U(1)做中心扩张后的线性表示,但对su(2)的例子,其中心扩张是trivial的)的群,也就是SO(3)的通用覆盖SU(2)。
为什么要从无穷下的角度出发,一个可能的解释是对于更一般的情况例如CFT,其conformal symmetry的“对称群”,2D conformal group实际上并不是一个well defined的group(有一个结论是无法从W代数和V代数构建一个Lie group),所以我们直接考虑其无穷小变换Witt algebra的u(1)中心扩张也就是Virasoro algebra的表示。
-------
我觉得谈论形状没什么意义。
在量子力学里面讨论系统的对称性其实更方便的是从无穷小的角度(数学上也就是Lie group的线性化----Lie algebra)去做计算,比如这里的旋转群SO(3),但因为是从无穷小的层面出发(local),得到的整体性质最natural的应该是没有拓扑障碍(这时就像第一个回答所说的,可以把投影表示lift为线性表示,在做lifting的时候实际上我们考虑的是SU(2)被U(1)做中心扩张后的线性表示,但对su(2)的例子,其中心扩张是trivial的)的群,也就是SO(3)的通用覆盖SU(2)。
为什么要从无穷下的角度出发,一个可能的解释是对于更一般的情况例如CFT,其conformal symmetry的“对称群”,2D conformal group实际上并不是一个well defined的group(有一个结论是无法从W代数和V代数构建一个Lie group),所以我们直接考虑其无穷小变换Witt algebra的u(1)中心扩张也就是Virasoro algebra的表示。
如果稍微延伸一下,比如考察一下石墨烯中的pseudo spin ,也许可以有更直观的理解。其波函数有两个分量,每个分量的相位对应于倒空间中的波矢k(相对于Dirac 点)。其形式上和真正的spin很象,即相位是要增加4pi 才回到原状态。这对应什么事实呢?即题主所说的这个态要在k空间绕两圈才能封闭(即回到原态)。这个有pseudo spin的态,反映了所在的k空间的拓扑性质,即此二维的k空间不是简单的曲面,而是有奇点的,即Dirac点。所以此态绕Dirac 点一圈不能回到原态,换言之做封闭曲线积分不为零。这也即是复变函数里的留数定理所说的,闭合曲面里存在奇点。如果没有奇点,积分为零,波函数获得相位2pi,回到原态。事实上,环绕一圈后此态获得相位Pi,所谓berry phase, 反映的就是k空间在Dirac 点附近的拓扑性质。正是此有奇点的空间性质造成的berry phase,造成比如特殊的量子霍尔平台等等啥的。而回到原问题,这个「粒子」什么样子的?只能说你把它投影到实空间看吧,实际上波函数在实空间中分布在两套格点上(石墨烯晶格为复格子,有两套不等价格点).所以可以想象这个所谓「粒子」并不是一个实空间中的一个很局域像波包一样的东西。
很多回答的都太高深,用了各种场论和群论的理论。理论首先是用来描述客观现实规律的,然后这一规律有了发展和预测。至于高维空间是理论的发展和描述,有些是解释和想象,帮助理解的。所以还是回到自旋概念的产生和客观现实上来。物理是依托于实验的。所以从实验上理解最简单。
自旋的提出是因为电子在磁场中观测到新的能级分裂。量子力学的能级是离散的,薛定谔方程的解也就是现实从在的能量数值要符合整数条件,就有量子数的概念。而磁场下这个能级分裂的自旋量子数和实验符合的正好1/2。.从宏观上想,如果电子自己旋转就会和磁场有相互作用,所以这个能级分裂的量子数就命名为自旋了。至于是实际是如何,没有什么直接的观测来证实。尺度太小。
自旋的提出是因为电子在磁场中观测到新的能级分裂。量子力学的能级是离散的,薛定谔方程的解也就是现实从在的能量数值要符合整数条件,就有量子数的概念。而磁场下这个能级分裂的自旋量子数和实验符合的正好1/2。.从宏观上想,如果电子自己旋转就会和磁场有相互作用,所以这个能级分裂的量子数就命名为自旋了。至于是实际是如何,没有什么直接的观测来证实。尺度太小。
科学网—规范场- 吴新忠的博文
blog.sciencenet.cn/blog-1668877-823643.html
轉為繁體網頁
轉為繁體網頁
旋转群及洛伦茨群的表示.pdf - 理学- 教育资料- 爱分享网(免费 ...
www.ishare5.com › 教育资料 › 理学
轉為繁體網頁
轉為繁體網頁
物理学中的群论: 9787040312058: : 物理学 - JD.com
en.jd.com/product/chinese-books/10967045.html
轉為繁體網頁
轉為繁體網頁
在洛伦兹群里 - phymath999
phymath999.blogspot.com/2013/03/blog-post_5904.html
轉為繁體網頁
轉為繁體網頁
《物理学中的群论/物理学研究生教学丛书》陶瑞宝著_简介_ ...
product.dangdang.com/22687913.html
轉為繁體網頁
轉為繁體網頁
自旋为1/2的粒子是什么形状的,三维真的有转两圈才能和自己 ...
www.zhihu.com/question/26677689
轉為繁體網頁
轉為繁體網頁
我自己阅读的一点理解
2014-10-18 23:06:18 来自: 七星之城
The Quantum Theory of Fields Volume I:Foundations的评论 5
提示: 有关键情节透露
The Quantum Theory of Fields Volume I:Foundations的评论 5
提示: 有关键情节透露
Weinberg量子场论阅读笔记 ——写在四读Weinberg I之后
------------------
一
前些天备考规范场论,顺带着把Weinberg复习了一遍,发现不仅以前熟悉的公式遗忘速度惊人,连前几次读时令我拍案叫绝欲罢不能的思想都已然在脑中模糊不清,于是痛定思痛打算写个笔记。下面的每节是我对Weinberg各章主要内容的理解。
二
对称性的意思是当事物处在一个态时观测其处于另一个态的概率不依赖于观察者的时空位置与运动状态(也即坐标架与惯性系的选择)。由此 Wigner 推出对于不同观察者的态之间通过一个幺正或反幺正算符转换。特别地,不同时刻的观察者观察到的态也由一个幺正算符转换。
狭义相对论基本公理——所有保持平直的时空坐标变换需满足任意两个事件的时空间隔不变性。
我们将洛伦兹对称性导致的幺正算符做小量展开时的一阶项系数标记为H、P、J、K,群所需满足的结合律使得这四个系数算符需要满足一定的关系——实际上是他们之间的对易关系。我们根据这些对易关系而赋予四个算符的物理含义,例如依据 [H,P]=[H,K]=0 我们将 H 命名为能量,依据 [Ji,Jj]=i Jk 而将 J 命名为角动量。
什么是粒子?我们将单粒子态定义为动量算符 P 的本征态。
由于四动量平方(P^2)在适当正时洛伦兹变换下不变,因而具有不同的四动量的粒子态可分为六类。
上述的分类并不完全,因为同种四动量分类下的粒子依然可以有不同的态。继续分类的方法是,对有正静能的粒子,在其保持动量不变的群(即 little group)下变换时,我们将洛伦兹变换后仍是同一组态的线性组合时的这个集合归类为拥有某个自旋的粒子。因为矩阵是群表示的理想工具,因而我们数学上可以将粒子态表示为分量形式,相应的洛伦兹变换算符即具有矩阵的形式。
零质量粒子可能拥有连续本征值的属性,但因目前尚未发现具有此属性的粒子,因此所有已知的零质量粒子只能用运动方向上的角动量(即螺旋度)来分类。如果正负同螺旋度的粒子可以相互转换(例如具有空间反演对称性的电磁相互作用中的光子),从而被归类为一种粒子。由三维旋转群的双连通性质,可以得出自旋必须是整数或半整数。
除开弱相互作用,强相互作用和电磁相互作用都具备空间反演对称性,因而有相应守恒量,此守恒量称为宇称。
三
自由多粒子态由单粒子态直积得到。
粒子实验中的入态和出态由包含相互作用的完整哈密顿量定义。
将哈密顿量拆成自由场和相互作用场后可以写出从自由场出入态(即动量本征态)导出相互作用场出入态的严格的Lippmann-Schwinger方程。
入态和出态的内积称为 S 矩阵,可由此定义 S 算符。代入Lippmann-Schwinger方程可以得到 S 矩阵的波恩近似。
哈密顿量密度对类空间隔对易的条件以及相互作用势的平滑性条件保证了散射过程的 S 矩阵的洛伦兹对称性。
同位旋对称性、全局对称性、空间反演对称性都会反映在 S 矩阵的对称性上,并导致相应守恒量。
从 S 矩阵可以导出实验上观测的出射粒子动量角分布,即微分散射截面。
S 矩阵满足一个微分方程,可以通过微扰展开得到解,所以 S 矩阵可以写成哈密顿量的时序积分形式。
由 S 矩阵的幺正性可以得到光学定理、玻尔兹曼H定理、细致平衡条件。
四
出于数学上构造哈密顿量的目的,我们抽象地定义升降算符(谐振子可以为此抽象框架提供一个具体的实现模型,但并不必要,实际上整套量子场论的叙述可以完全脱离谐振子的语境)。升降算符的对易关系由定义和交换对称性(或反对称性)即可得到。
因果性原理要求类空间隔的事件不相互影响,此即S矩阵需满足的集团分解原理(Cluster decomposition principle)。
由于任何哈密顿量均可由升降算符构成的基组合得到,而且当系数满足恰有一个三维动量守恒 δ 函数时哈密顿量必然满足集团分解原理,因此我们喜爱用升降算符来构造哈密顿量。
因为我们可以直接用粒子数算符乘上单粒子态能量做积分写出自由场(即无相互作用)中的哈密顿量,这就对自由场哈密顿量的形式给出了限制。
我们需要拉格朗日框架的理由是:在拉格朗日框架中能够有效地分析对称性。
作用量泛函的全局对称性导致守恒流算符,其相应荷的全空间积分守恒,此即诺特定理。
五
由于升降算符在洛伦兹变换下有复杂的变换公式,因此一个用升降算符构造标量哈密顿量密度的便捷方法是先将升降算符分别组合成洛伦兹变换公式较为简单的升降场算符(指产生场算符ψ-和湮灭场算符ψ+)。
升降场算符在洛伦兹变换下的性质限制了升降场算符的变换矩阵必须是洛伦兹群的表示,于是我们依照洛伦兹群表示给不同的升降场算符分类。
一组不同的场算符在洛伦兹变换后结果可能是原有算符的线性组合,我们将这样一组场算符归类为同一个场的不同分量。
升降场算符尚且不能直接满足类空间隔对易条件(或反对易条件),一个可行的办法是将升降场算符(ψ-和ψ+)线性组合得到场算符(ψ),场算符则可以满足类空间隔对易条件(或反对易条件)。因此我们通过场算符来方便地构造的哈密顿量密度可以满足类空间隔对易条件。
场算符作用在真空态上得到的态的物理意义是一个在此时空点的粒子,但注意其波函数是延展的,仅仅在非相对论近似下此波函数才是δ函数。
场算符表示的粒子的自旋只能与场算符需要满足的类空间隔对易条件或反对易条件中的一个数学上相容,此即导致了自旋-统计定理。
这样构建的场算符自动满足Klein-Gordon方程。
螺旋度是零质量粒子在运动方向上的角动量,严格的螺旋度概念只对零质量粒子适用。手性是按照场算符属于洛伦兹群的左手表示还是右手表示来定义。对于零质量粒子,左手(右手)螺旋度的粒子对应左手(右手)手性的场算符。
全局对称性导致的荷守恒要求哈密顿量密度与荷算符(Q)对易,这可以通过要求荷算符与场算符对易而达到,这一要求导致对此载荷粒子存在相应的反粒子。
用场算符构造的具有洛伦兹标量哈密顿量密度的理论自动满足 CPT 定理。
对自旋大于等于1/2的零质量粒子,其场算符数学上不能满足前述的简单的洛伦兹变换公式,而有一个多出项。一个方案是由此场算符(Aμ)构造消去了多出项的反对称张量场算符(Fμν)作为出发点,但这样的理论无法具有长程相互作用。另一个方案是通过设定拉格朗日量密度满足相应的规范对称性来保证 S 矩阵的洛伦兹不变性,详见第八部分。
类似地,引力子需要满足对应的广义协变对称性以包含长程作用力。由于现实中未发现更高阶的守恒张量,因而高自旋粒子不能具有长程相互作用。
六
S 矩阵微扰计算的积分无穷级数公式可以可视化为费曼图。
传播子是公式展开中对应于连接两个顶点的项,计算出来后包含一个非协变的奇异项(起源于时序算符的奇异性),此奇异项会被相互作用哈密顿量中对应的奇异项消除。
S 矩阵傅里叶变换后得到的动量空间S矩阵在数学上更便捷。
七
因为标量场算符和其时间导数满足的等时对易关系令人联想起分析力学中相应的对易关系,因此我们类似地定义正则坐标和正则动量算符,证明其满足哈密顿方程,从而建立起场论的哈密顿框架。
根据已知的自由场哈密顿量用升降算符表示的形式,我们可以写出一个用正则变量表示的哈密顿量密度(会有一个真空能的差别)。
通过勒让德变换,我们可以从哈密顿框架转换到拉格朗日框架。
升降算符对易关系、正则坐标算符对易关系、哈密顿方程、拉格朗日方程,四者相互等价,传统讲法则是以拉格朗日方程作为建立量子场论的出发点。
当我们要从自由场转换到相互作用场时,只需在哈密顿框架或拉格朗日框架中自由场的对应量上加上相互作用标量算符项即可。
我们无法直接解出有相互作用的场方程,因此我们转换到相互作用表象中,在此表象中场算符满足自由场中的场方程,从而可以解出。
一个满足平滑条件和洛伦兹不变性的拉格朗日量密度具有的散射过程的 S 矩阵满足洛伦兹不变性,而构造具有洛伦兹不变性的拉格朗日量密度数学上比较简单,这是我们偏爱朗格朗日框架的原因之一。
拉格朗日量自身的奇异性或者采取特定规范的处理会导致场方程出现奇异性。奇异性可能导致方程不完备或者传统的对易关系与场方程矛盾。相应的解决办法是选定规范条件,采用狄拉克对易子替代原有对易关系。
八
第五章中已提到,对自旋大于等于1/2的零质量粒子,其场算符在洛伦兹变换下有一个多出项,这一项会破坏哈密顿量密度的标量性质,破坏 S 矩阵的洛伦兹不变性。因为此多出项是一个算符的散度,因此一种可行的解决办法是让此多出项恰好是一个守恒流算符的散度,从而自然等于零,这就导致需要引入一个拥有局域对称性的场,称为规范场。载荷粒子场的局域对称变换和零质量粒子的洛伦兹变换多出项合称为规范变换。运用引入规范场的方法我们最终重新获得了拉格朗日量密度在洛伦兹变换以及规范变换下的不变性。
这样的构建方式以自旋大于等于1/2的零质量粒子对应场算符无法直接构建标量哈密顿量密度为出发点,而传统讲法则是以规范变换作为出发点。
规范不变性导致场方程不完备,解决方法是固定规范。固定规范后传统的对易关系不能被满足,我们使用狄拉克括号的方法修改对易关系。随后即可通过勒让德变换得出哈密顿量,再转入相互作用表象后即可算出传播子,写出费曼规则,量子电动力学模型即建成。
九
由正则变量对易关系可以导出路劲积分公式。如果哈密顿量是正则动量的二次函数,则可积出动量部分得到关于作用量泛函的路劲积分。
通过一系列形式运算可以得出费曼规则和传播子。
对于费米子场,相应正则变量满足反对易关系,因此路劲积分需要的正则变量的本征值也应当满足反对易关系。复数不能满足此关系,因此引入Grassmann代数和其上的微积分。
十
对称性让我们能够得出一些非微扰结论。
考虑圈图对出腿、入腿函数(u*和u)的影响会导致它们与我们最初费曼规则的定义有所不同,对称性分析指出考虑所有非微扰效应后的出腿、入腿函数与最初费曼规则的出腿、入腿函数只相差一个因子(此因子实际上发散),因此我们修改场算符的定义——此即场算符的重整化——来使出腿、入腿函数回归到最初费曼规则的定义(因此算散射过程时外腿上的圈不用计算)。此场算符的重整化体现在自由场算符在升降算符上展开时比原先多了重整化系数,也就是说这个原先可以自由选择的系数现在要被确定。
粒子质量可以自然地采用单粒子态四动量的平方来定义,这个质量与自由场拉格朗日量密度中出现的质量是同一个。当有相互作用时,这套质量的定义方案不易实现,因此我们用考虑所有非微扰效应后的传播子的极点位置来定义。
重整化导致我们重新将用裸场算符写成的拉格朗日量密度作为基本公理,其中的质量、耦合常数也应当是裸质量、裸耦合常数。
理论上我们可以直接使用裸拉格朗日量密度(L)计算散射过程,因为实际上如此计算的总散射过程并没有发散。每一项表观的“发散困难”仅仅是由公式中有无穷大系数的裸场算符、裸质量、裸耦合、以及需要考虑的外腿上的圈、需要考虑的无穷多个图造成的,这个表观的“发散”本质上是源于我们不能直接处理这里的数学困难。
为避开前述的数学困难,我们人为地将裸拉格朗日量密度拆开成两部分(L=L0+L1),第一部分(自由场项)通过将无穷大扔给抵消项的方式而使其导出的传播子不发散,第二部分(包括抵消项和相互作用项)全部被视作相互作用,使用微扰方法计算(因此实际上这个微扰项远比第一部分大;尽管如此,数学却是很奇妙的)。运用这样的数学技巧我们就通过分离不同的无穷大再相互抵消而避开了我们前述的数学上直接处理多个无穷大的困难。
耦合常数随能标的跑动源于耦合常数定义的不同。裸耦合常数具有确定值,而重整化的耦合常数中的重整化系数依赖于其定义所在能标,因此不同能标定义的重整化耦合常数可以联系起来,进而求出相应的β函数。
Ward 恒等式是另一个重要的非微扰结论,其来源不过是将n点格林函数与(n-1)点格林函数联系起来。此恒等式的历史价值在于绕开二圈图计算中的重叠发散(overlapping divergence)问题。
电子的“自旋磁矩”这个词有一定误导作用,电子的磁矩确实与自旋有关,因为不同自旋的粒子有其特定的电磁作用顶点。但一般而言,粒子的磁矩和自旋之间没有简单的关系。例如中微子自旋同为二分之一,但磁矩为零。
十一
Pauli-Villars正规化和维数正规化的计算方法都是面向一个目的——定量地处理无穷大计算并让他们相互抵消,因此表征这个无穷大的量具体是什么——截止能量还是维度——并不重要。用能量截止处理无穷大会遇到规范对称性被破坏的麻烦,因此维度正规化更为推荐。
当费曼图中有电子外腿时,即会出现红外发散,这源于外腿电子发射低能光子。
十二
有效场论的概念源于1935年将光子间一圈相互作用近似成电磁场拉格朗日量的高阶项,其数学上等效于在路径积分中将低能下不会产生的重粒子(在光子相互作用中是正负电子)的场算符预先做积分,最后留下不含重粒子的有效拉格朗日量。
即使是对传统上的不可重整化理论,我们也可以通过在拉格朗日量中添加完整所有满足对称性的项、然后同时调整所有的自由参数来可消去发散。在这个意义下,量子引力理论可能也能够写成量子场论的形式,并且在低能近似下成为有效场论。
有效场论为现实中场论的拉格朗日量密度中只出现可重整项的现象提供了一个可能的(仅仅是可能)解释方法:不可重整项中包含的负能量量纲耦合常数中的能量量纲来自于更高能标的未知粒子,在低能下被压低而致其效应可忽略。
更重要的是,在这样的理解下,写出一个理论的拉格朗日量密度不再是依靠纯粹的猜测或类比经典模型,而是一开始就在拉格朗日量密度中写出所有保证哈密顿量具有有限下界、满足洛伦兹对称性和规范对称性(我们确实不知道为何有特定的规范对称性)的所有可能的项,然后在有效场论的意义下丢掉被压低的所有不可重整项。正是这样的构建方式,解释了为何拉格朗日量、或哈密顿量、或场方程采取了我们如今已经默认了的形式。正是这样的一整套思路,超越了以类比的方式写出场方程作为出发点的大多数量子场论书。
十三
在有内线软光子的圈图中,我们也会遇到红外发散,为解决此问题我们引入界定虚软光子(即内线软光子)三维动量大小的上、下限参数。其中上限参数与圈图计算中的光子动量下限衔接,下限参数用于表征无穷大。
对于实软光子引起的红外发散,我们引入探测器阈值、遗漏能量两个参数。探测器阈值是光子探测器能保证记录事例时的光子能量阈值,遗漏能量是所有未被探测到的光子的能量总和。
上述四个参数中,探测器阈值与遗漏能量参数会真正保留在散射截面的最后结果中,其中令探测器阈值参数趋于零将引起散射截面实质的发散,这是可以直观理解的。而上限参数与圈图计算设定的光子能量下限相抵消,下限参数与实软光子积分中取的下限相抵消。
在量子电动力学中,假设电子静质量为零,则出射态同时有动量平行的电子和软光子会导致红外发散。类似地,量子色动力学中动量平行的强子与软胶子也导致红外发散。这种情况甚至要求散射过程的入态也要受到无红外发散条件的限制。这可以通过我们实验上区分动量平行的零质量粒子时遇到的困难、以及制备动量平行的零质量粒子入态总是呈喷流形态来解释。
仅使用对称性即可证明光散射公式的低能极限只与粒子的质量和电荷有关。
本章最后一节演示了使用量子场论的工具可神奇地推导出经典场论的库伦势。
十四(第一章 历史)
根据狄拉克的回忆,薛定谔在他得到薛定谔方程之前,也在Klein和Gordon之前率先发现了Klein-Gordon方程,但因为Klein-Gordon方程给出了错误的氢原子精细结构而放弃了它,直到几个月后他意识到其非相对论近似得出的薛定谔方程还有一定价值。
狄拉克1928年对描述电子的狄拉克方程的发现及其随后取得的巨大成功有很大巧合的成分:狄拉克寻找一个新方程的动机是解决Klein-Gordon方程的负概率困难,但如今我们清楚负概率问题源于错误地为解赋予概率意义,Klein-Gordon方程本身对于描述零自旋粒子也很有意义。狄拉克通过负质量解预言反粒子存在的方式不仅会引起与负能海相关的一系列问题,而且实质上也仅仅是一个富有启发性的比喻,他不能解释载荷玻色子也有相应反粒子的事实。狄拉克方程预言了正确的电子磁矩的零阶项,但在方程中添加一个Pauli term完全可以将电子磁矩调到任意大小,实际上最终是可重整性限制了量子场论中Pauli term的存在。
结语
一不小心就写了几千字,细想来,读此书或许也排得上整个大学中最重要的几件事了。
我是一个寻求感性理解的人。学习场论的前几年,我都为场论中的词汇感到困惑:什么是升降算符(我以前一直以为升、降算符是一个实际的操作)?谐振子的激发态为什么就是粒子?传播子是什么含义?为什么要把好好的场变成算符?为什么你们的拉格朗日量都长得这么奇怪?二分之一自旋是什么(小学看霍金时就百思不得其解)?维数正规化为什么不是扯蛋?
对这些概念的理解和思考严重地阻碍了我的学习,尤其是当思考的终结点时常停在不可言说的量子态的概念和测量的坍缩问题上时。
如今,有幸能有Weinberg的指点,在几年的沉淀后,我现在也终于能感到量子场论实实在在地站立在一个公理般的基础上,我相信它是这个世界的描述,相信它的构建逻辑,正如本书前言所说:相信它是所有融合了量子力学和狭义相对论的理论在低能近似下必将拥有的形式。
回想2011年秋在天文班自习室初读本书的时候,那时只能看得懂第一章。如今结合了这些全新的理解,更是感慨万千。
第一次做这些计算的前辈,不会如今天的我们这样理解得如此深刻,他们一些人的推理错误百出,甚至觉得这些计算不过是个玩笑。这个场面是如此的似曾相识。即使在贝克莱大主教的批判声中无言以对,整个19世纪的数学家依然建立起了宏伟的分析大厦。即使马赫原理的主旨已不能与后来的广义相对论相吻合,也不可否认爱因斯坦早年从中所汲取的营养。
多年的乱象中总会涌现曲折的前进,逻辑的困难阻挡不住精巧的尝试。人类思维正因这从现象的凌乱中发现模式的能力而愈见其无可比拟。
七星之城
2014年 夏
------------------
一
前些天备考规范场论,顺带着把Weinberg复习了一遍,发现不仅以前熟悉的公式遗忘速度惊人,连前几次读时令我拍案叫绝欲罢不能的思想都已然在脑中模糊不清,于是痛定思痛打算写个笔记。下面的每节是我对Weinberg各章主要内容的理解。
二
对称性的意思是当事物处在一个态时观测其处于另一个态的概率不依赖于观察者的时空位置与运动状态(也即坐标架与惯性系的选择)。由此 Wigner 推出对于不同观察者的态之间通过一个幺正或反幺正算符转换。特别地,不同时刻的观察者观察到的态也由一个幺正算符转换。
狭义相对论基本公理——所有保持平直的时空坐标变换需满足任意两个事件的时空间隔不变性。
我们将洛伦兹对称性导致的幺正算符做小量展开时的一阶项系数标记为H、P、J、K,群所需满足的结合律使得这四个系数算符需要满足一定的关系——实际上是他们之间的对易关系。我们根据这些对易关系而赋予四个算符的物理含义,例如依据 [H,P]=[H,K]=0 我们将 H 命名为能量,依据 [Ji,Jj]=i Jk 而将 J 命名为角动量。
什么是粒子?我们将单粒子态定义为动量算符 P 的本征态。
由于四动量平方(P^2)在适当正时洛伦兹变换下不变,因而具有不同的四动量的粒子态可分为六类。
上述的分类并不完全,因为同种四动量分类下的粒子依然可以有不同的态。继续分类的方法是,对有正静能的粒子,在其保持动量不变的群(即 little group)下变换时,我们将洛伦兹变换后仍是同一组态的线性组合时的这个集合归类为拥有某个自旋的粒子。因为矩阵是群表示的理想工具,因而我们数学上可以将粒子态表示为分量形式,相应的洛伦兹变换算符即具有矩阵的形式。
零质量粒子可能拥有连续本征值的属性,但因目前尚未发现具有此属性的粒子,因此所有已知的零质量粒子只能用运动方向上的角动量(即螺旋度)来分类。如果正负同螺旋度的粒子可以相互转换(例如具有空间反演对称性的电磁相互作用中的光子),从而被归类为一种粒子。由三维旋转群的双连通性质,可以得出自旋必须是整数或半整数。
除开弱相互作用,强相互作用和电磁相互作用都具备空间反演对称性,因而有相应守恒量,此守恒量称为宇称。
三
自由多粒子态由单粒子态直积得到。
粒子实验中的入态和出态由包含相互作用的完整哈密顿量定义。
将哈密顿量拆成自由场和相互作用场后可以写出从自由场出入态(即动量本征态)导出相互作用场出入态的严格的Lippmann-Schwinger方程。
入态和出态的内积称为 S 矩阵,可由此定义 S 算符。代入Lippmann-Schwinger方程可以得到 S 矩阵的波恩近似。
哈密顿量密度对类空间隔对易的条件以及相互作用势的平滑性条件保证了散射过程的 S 矩阵的洛伦兹对称性。
同位旋对称性、全局对称性、空间反演对称性都会反映在 S 矩阵的对称性上,并导致相应守恒量。
从 S 矩阵可以导出实验上观测的出射粒子动量角分布,即微分散射截面。
S 矩阵满足一个微分方程,可以通过微扰展开得到解,所以 S 矩阵可以写成哈密顿量的时序积分形式。
由 S 矩阵的幺正性可以得到光学定理、玻尔兹曼H定理、细致平衡条件。
四
出于数学上构造哈密顿量的目的,我们抽象地定义升降算符(谐振子可以为此抽象框架提供一个具体的实现模型,但并不必要,实际上整套量子场论的叙述可以完全脱离谐振子的语境)。升降算符的对易关系由定义和交换对称性(或反对称性)即可得到。
因果性原理要求类空间隔的事件不相互影响,此即S矩阵需满足的集团分解原理(Cluster decomposition principle)。
由于任何哈密顿量均可由升降算符构成的基组合得到,而且当系数满足恰有一个三维动量守恒 δ 函数时哈密顿量必然满足集团分解原理,因此我们喜爱用升降算符来构造哈密顿量。
因为我们可以直接用粒子数算符乘上单粒子态能量做积分写出自由场(即无相互作用)中的哈密顿量,这就对自由场哈密顿量的形式给出了限制。
我们需要拉格朗日框架的理由是:在拉格朗日框架中能够有效地分析对称性。
作用量泛函的全局对称性导致守恒流算符,其相应荷的全空间积分守恒,此即诺特定理。
五
由于升降算符在洛伦兹变换下有复杂的变换公式,因此一个用升降算符构造标量哈密顿量密度的便捷方法是先将升降算符分别组合成洛伦兹变换公式较为简单的升降场算符(指产生场算符ψ-和湮灭场算符ψ+)。
升降场算符在洛伦兹变换下的性质限制了升降场算符的变换矩阵必须是洛伦兹群的表示,于是我们依照洛伦兹群表示给不同的升降场算符分类。
一组不同的场算符在洛伦兹变换后结果可能是原有算符的线性组合,我们将这样一组场算符归类为同一个场的不同分量。
升降场算符尚且不能直接满足类空间隔对易条件(或反对易条件),一个可行的办法是将升降场算符(ψ-和ψ+)线性组合得到场算符(ψ),场算符则可以满足类空间隔对易条件(或反对易条件)。因此我们通过场算符来方便地构造的哈密顿量密度可以满足类空间隔对易条件。
场算符作用在真空态上得到的态的物理意义是一个在此时空点的粒子,但注意其波函数是延展的,仅仅在非相对论近似下此波函数才是δ函数。
场算符表示的粒子的自旋只能与场算符需要满足的类空间隔对易条件或反对易条件中的一个数学上相容,此即导致了自旋-统计定理。
这样构建的场算符自动满足Klein-Gordon方程。
螺旋度是零质量粒子在运动方向上的角动量,严格的螺旋度概念只对零质量粒子适用。手性是按照场算符属于洛伦兹群的左手表示还是右手表示来定义。对于零质量粒子,左手(右手)螺旋度的粒子对应左手(右手)手性的场算符。
全局对称性导致的荷守恒要求哈密顿量密度与荷算符(Q)对易,这可以通过要求荷算符与场算符对易而达到,这一要求导致对此载荷粒子存在相应的反粒子。
用场算符构造的具有洛伦兹标量哈密顿量密度的理论自动满足 CPT 定理。
对自旋大于等于1/2的零质量粒子,其场算符数学上不能满足前述的简单的洛伦兹变换公式,而有一个多出项。一个方案是由此场算符(Aμ)构造消去了多出项的反对称张量场算符(Fμν)作为出发点,但这样的理论无法具有长程相互作用。另一个方案是通过设定拉格朗日量密度满足相应的规范对称性来保证 S 矩阵的洛伦兹不变性,详见第八部分。
类似地,引力子需要满足对应的广义协变对称性以包含长程作用力。由于现实中未发现更高阶的守恒张量,因而高自旋粒子不能具有长程相互作用。
六
S 矩阵微扰计算的积分无穷级数公式可以可视化为费曼图。
传播子是公式展开中对应于连接两个顶点的项,计算出来后包含一个非协变的奇异项(起源于时序算符的奇异性),此奇异项会被相互作用哈密顿量中对应的奇异项消除。
S 矩阵傅里叶变换后得到的动量空间S矩阵在数学上更便捷。
七
因为标量场算符和其时间导数满足的等时对易关系令人联想起分析力学中相应的对易关系,因此我们类似地定义正则坐标和正则动量算符,证明其满足哈密顿方程,从而建立起场论的哈密顿框架。
根据已知的自由场哈密顿量用升降算符表示的形式,我们可以写出一个用正则变量表示的哈密顿量密度(会有一个真空能的差别)。
通过勒让德变换,我们可以从哈密顿框架转换到拉格朗日框架。
升降算符对易关系、正则坐标算符对易关系、哈密顿方程、拉格朗日方程,四者相互等价,传统讲法则是以拉格朗日方程作为建立量子场论的出发点。
当我们要从自由场转换到相互作用场时,只需在哈密顿框架或拉格朗日框架中自由场的对应量上加上相互作用标量算符项即可。
我们无法直接解出有相互作用的场方程,因此我们转换到相互作用表象中,在此表象中场算符满足自由场中的场方程,从而可以解出。
一个满足平滑条件和洛伦兹不变性的拉格朗日量密度具有的散射过程的 S 矩阵满足洛伦兹不变性,而构造具有洛伦兹不变性的拉格朗日量密度数学上比较简单,这是我们偏爱朗格朗日框架的原因之一。
拉格朗日量自身的奇异性或者采取特定规范的处理会导致场方程出现奇异性。奇异性可能导致方程不完备或者传统的对易关系与场方程矛盾。相应的解决办法是选定规范条件,采用狄拉克对易子替代原有对易关系。
八
第五章中已提到,对自旋大于等于1/2的零质量粒子,其场算符在洛伦兹变换下有一个多出项,这一项会破坏哈密顿量密度的标量性质,破坏 S 矩阵的洛伦兹不变性。因为此多出项是一个算符的散度,因此一种可行的解决办法是让此多出项恰好是一个守恒流算符的散度,从而自然等于零,这就导致需要引入一个拥有局域对称性的场,称为规范场。载荷粒子场的局域对称变换和零质量粒子的洛伦兹变换多出项合称为规范变换。运用引入规范场的方法我们最终重新获得了拉格朗日量密度在洛伦兹变换以及规范变换下的不变性。
这样的构建方式以自旋大于等于1/2的零质量粒子对应场算符无法直接构建标量哈密顿量密度为出发点,而传统讲法则是以规范变换作为出发点。
规范不变性导致场方程不完备,解决方法是固定规范。固定规范后传统的对易关系不能被满足,我们使用狄拉克括号的方法修改对易关系。随后即可通过勒让德变换得出哈密顿量,再转入相互作用表象后即可算出传播子,写出费曼规则,量子电动力学模型即建成。
九
由正则变量对易关系可以导出路劲积分公式。如果哈密顿量是正则动量的二次函数,则可积出动量部分得到关于作用量泛函的路劲积分。
通过一系列形式运算可以得出费曼规则和传播子。
对于费米子场,相应正则变量满足反对易关系,因此路劲积分需要的正则变量的本征值也应当满足反对易关系。复数不能满足此关系,因此引入Grassmann代数和其上的微积分。
十
对称性让我们能够得出一些非微扰结论。
考虑圈图对出腿、入腿函数(u*和u)的影响会导致它们与我们最初费曼规则的定义有所不同,对称性分析指出考虑所有非微扰效应后的出腿、入腿函数与最初费曼规则的出腿、入腿函数只相差一个因子(此因子实际上发散),因此我们修改场算符的定义——此即场算符的重整化——来使出腿、入腿函数回归到最初费曼规则的定义(因此算散射过程时外腿上的圈不用计算)。此场算符的重整化体现在自由场算符在升降算符上展开时比原先多了重整化系数,也就是说这个原先可以自由选择的系数现在要被确定。
粒子质量可以自然地采用单粒子态四动量的平方来定义,这个质量与自由场拉格朗日量密度中出现的质量是同一个。当有相互作用时,这套质量的定义方案不易实现,因此我们用考虑所有非微扰效应后的传播子的极点位置来定义。
重整化导致我们重新将用裸场算符写成的拉格朗日量密度作为基本公理,其中的质量、耦合常数也应当是裸质量、裸耦合常数。
理论上我们可以直接使用裸拉格朗日量密度(L)计算散射过程,因为实际上如此计算的总散射过程并没有发散。每一项表观的“发散困难”仅仅是由公式中有无穷大系数的裸场算符、裸质量、裸耦合、以及需要考虑的外腿上的圈、需要考虑的无穷多个图造成的,这个表观的“发散”本质上是源于我们不能直接处理这里的数学困难。
为避开前述的数学困难,我们人为地将裸拉格朗日量密度拆开成两部分(L=L0+L1),第一部分(自由场项)通过将无穷大扔给抵消项的方式而使其导出的传播子不发散,第二部分(包括抵消项和相互作用项)全部被视作相互作用,使用微扰方法计算(因此实际上这个微扰项远比第一部分大;尽管如此,数学却是很奇妙的)。运用这样的数学技巧我们就通过分离不同的无穷大再相互抵消而避开了我们前述的数学上直接处理多个无穷大的困难。
耦合常数随能标的跑动源于耦合常数定义的不同。裸耦合常数具有确定值,而重整化的耦合常数中的重整化系数依赖于其定义所在能标,因此不同能标定义的重整化耦合常数可以联系起来,进而求出相应的β函数。
Ward 恒等式是另一个重要的非微扰结论,其来源不过是将n点格林函数与(n-1)点格林函数联系起来。此恒等式的历史价值在于绕开二圈图计算中的重叠发散(overlapping divergence)问题。
电子的“自旋磁矩”这个词有一定误导作用,电子的磁矩确实与自旋有关,因为不同自旋的粒子有其特定的电磁作用顶点。但一般而言,粒子的磁矩和自旋之间没有简单的关系。例如中微子自旋同为二分之一,但磁矩为零。
十一
Pauli-Villars正规化和维数正规化的计算方法都是面向一个目的——定量地处理无穷大计算并让他们相互抵消,因此表征这个无穷大的量具体是什么——截止能量还是维度——并不重要。用能量截止处理无穷大会遇到规范对称性被破坏的麻烦,因此维度正规化更为推荐。
当费曼图中有电子外腿时,即会出现红外发散,这源于外腿电子发射低能光子。
十二
有效场论的概念源于1935年将光子间一圈相互作用近似成电磁场拉格朗日量的高阶项,其数学上等效于在路径积分中将低能下不会产生的重粒子(在光子相互作用中是正负电子)的场算符预先做积分,最后留下不含重粒子的有效拉格朗日量。
即使是对传统上的不可重整化理论,我们也可以通过在拉格朗日量中添加完整所有满足对称性的项、然后同时调整所有的自由参数来可消去发散。在这个意义下,量子引力理论可能也能够写成量子场论的形式,并且在低能近似下成为有效场论。
有效场论为现实中场论的拉格朗日量密度中只出现可重整项的现象提供了一个可能的(仅仅是可能)解释方法:不可重整项中包含的负能量量纲耦合常数中的能量量纲来自于更高能标的未知粒子,在低能下被压低而致其效应可忽略。
更重要的是,在这样的理解下,写出一个理论的拉格朗日量密度不再是依靠纯粹的猜测或类比经典模型,而是一开始就在拉格朗日量密度中写出所有保证哈密顿量具有有限下界、满足洛伦兹对称性和规范对称性(我们确实不知道为何有特定的规范对称性)的所有可能的项,然后在有效场论的意义下丢掉被压低的所有不可重整项。正是这样的构建方式,解释了为何拉格朗日量、或哈密顿量、或场方程采取了我们如今已经默认了的形式。正是这样的一整套思路,超越了以类比的方式写出场方程作为出发点的大多数量子场论书。
十三
在有内线软光子的圈图中,我们也会遇到红外发散,为解决此问题我们引入界定虚软光子(即内线软光子)三维动量大小的上、下限参数。其中上限参数与圈图计算中的光子动量下限衔接,下限参数用于表征无穷大。
对于实软光子引起的红外发散,我们引入探测器阈值、遗漏能量两个参数。探测器阈值是光子探测器能保证记录事例时的光子能量阈值,遗漏能量是所有未被探测到的光子的能量总和。
上述四个参数中,探测器阈值与遗漏能量参数会真正保留在散射截面的最后结果中,其中令探测器阈值参数趋于零将引起散射截面实质的发散,这是可以直观理解的。而上限参数与圈图计算设定的光子能量下限相抵消,下限参数与实软光子积分中取的下限相抵消。
在量子电动力学中,假设电子静质量为零,则出射态同时有动量平行的电子和软光子会导致红外发散。类似地,量子色动力学中动量平行的强子与软胶子也导致红外发散。这种情况甚至要求散射过程的入态也要受到无红外发散条件的限制。这可以通过我们实验上区分动量平行的零质量粒子时遇到的困难、以及制备动量平行的零质量粒子入态总是呈喷流形态来解释。
仅使用对称性即可证明光散射公式的低能极限只与粒子的质量和电荷有关。
本章最后一节演示了使用量子场论的工具可神奇地推导出经典场论的库伦势。
十四(第一章 历史)
根据狄拉克的回忆,薛定谔在他得到薛定谔方程之前,也在Klein和Gordon之前率先发现了Klein-Gordon方程,但因为Klein-Gordon方程给出了错误的氢原子精细结构而放弃了它,直到几个月后他意识到其非相对论近似得出的薛定谔方程还有一定价值。
狄拉克1928年对描述电子的狄拉克方程的发现及其随后取得的巨大成功有很大巧合的成分:狄拉克寻找一个新方程的动机是解决Klein-Gordon方程的负概率困难,但如今我们清楚负概率问题源于错误地为解赋予概率意义,Klein-Gordon方程本身对于描述零自旋粒子也很有意义。狄拉克通过负质量解预言反粒子存在的方式不仅会引起与负能海相关的一系列问题,而且实质上也仅仅是一个富有启发性的比喻,他不能解释载荷玻色子也有相应反粒子的事实。狄拉克方程预言了正确的电子磁矩的零阶项,但在方程中添加一个Pauli term完全可以将电子磁矩调到任意大小,实际上最终是可重整性限制了量子场论中Pauli term的存在。
结语
一不小心就写了几千字,细想来,读此书或许也排得上整个大学中最重要的几件事了。
我是一个寻求感性理解的人。学习场论的前几年,我都为场论中的词汇感到困惑:什么是升降算符(我以前一直以为升、降算符是一个实际的操作)?谐振子的激发态为什么就是粒子?传播子是什么含义?为什么要把好好的场变成算符?为什么你们的拉格朗日量都长得这么奇怪?二分之一自旋是什么(小学看霍金时就百思不得其解)?维数正规化为什么不是扯蛋?
对这些概念的理解和思考严重地阻碍了我的学习,尤其是当思考的终结点时常停在不可言说的量子态的概念和测量的坍缩问题上时。
如今,有幸能有Weinberg的指点,在几年的沉淀后,我现在也终于能感到量子场论实实在在地站立在一个公理般的基础上,我相信它是这个世界的描述,相信它的构建逻辑,正如本书前言所说:相信它是所有融合了量子力学和狭义相对论的理论在低能近似下必将拥有的形式。
回想2011年秋在天文班自习室初读本书的时候,那时只能看得懂第一章。如今结合了这些全新的理解,更是感慨万千。
第一次做这些计算的前辈,不会如今天的我们这样理解得如此深刻,他们一些人的推理错误百出,甚至觉得这些计算不过是个玩笑。这个场面是如此的似曾相识。即使在贝克莱大主教的批判声中无言以对,整个19世纪的数学家依然建立起了宏伟的分析大厦。即使马赫原理的主旨已不能与后来的广义相对论相吻合,也不可否认爱因斯坦早年从中所汲取的营养。
多年的乱象中总会涌现曲折的前进,逻辑的困难阻挡不住精巧的尝试。人类思维正因这从现象的凌乱中发现模式的能力而愈见其无可比拟。
七星之城
2014年 夏
No comments:
Post a Comment