质量的起源 by 卢昌海
一. 引言
物理学是一门试图在最基本的层次上理解自然的古老科学, 她的早期曾经是哲学的一部分。 在那个时期, 物理学所关心的是一些有关世界本原的问题。 那些问题看似朴素, 却极为困难。 在后来的漫长岁月里, 物理学曾经一次次地回到那些问题上来, 就像一个远行的水手一次次地回望灯塔。
“质量的起源” 便是一个有关世界本原的问题。
二. 宇宙物质的组成
我们首先来界定一下所要讨论的质量究竟是什么东西的质量。 这在以前是不言而喻的, 但现在情况却有了变化, 因此有必要加以界定。 众所周知, 过去十年里观测宇宙学所取得的一个令人瞩目的成就, 就是以较高的精度测定了宇宙物质的组成, 从而使我们在宇宙学的历史上第一次可以谈论所谓的 “精密宇宙学” (Precision Cosmology)。
按照这种 “精密宇宙学” 为我们绘出的图景, 在宇宙目前的能量密度中暗能量约占 72%, 暗物质约占 24%, 而我们所熟悉的所谓可见物质只占可怜兮兮的 4% (参阅 宇宙学常数、超对称及膜宇宙论)。 在这些组成部分中, 对暗能量与暗物质的研究目前还处于一个很初级的阶段, 尚未建立足够具体且有实验基础的理论。 因此本文对之不做讨论。
除去了暗能量与暗物质, 剩下的就是可见物质了。 可见物质在宇宙能量密度中所占的比例虽小, 却是我们所熟知的物质世界的主体。 可观测宇宙中近千亿的星系, 每个星系中近千亿的恒星, 以及某个不起眼的恒星附近第三颗行星上数十亿的灵长类生物, 全都包含在了这小小的 4% 之中[注一]。
本文要讨论的便是这 4% 的可见物质。
与 “暗” 字打头的其余 96% 的能量密度相比, 我们对可见物质的研究与了解都要深入得多。 今天几乎每一位中学生都知道, 这部分物质主要是由质子、 中子、 电子等粒子组成的。 因此很明显, 要讨论质量的起源, 归根到底是要讨论这些粒子的质量起源。
物理学是一门试图在最基本的层次上理解自然的古老科学, 她的早期曾经是哲学的一部分。 在那个时期, 物理学所关心的是一些有关世界本原的问题。 那些问题看似朴素, 却极为困难。 在后来的漫长岁月里, 物理学曾经一次次地回到那些问题上来, 就像一个远行的水手一次次地回望灯塔。
“质量的起源” 便是一个有关世界本原的问题。
二. 宇宙物质的组成
我们首先来界定一下所要讨论的质量究竟是什么东西的质量。 这在以前是不言而喻的, 但现在情况却有了变化, 因此有必要加以界定。 众所周知, 过去十年里观测宇宙学所取得的一个令人瞩目的成就, 就是以较高的精度测定了宇宙物质的组成, 从而使我们在宇宙学的历史上第一次可以谈论所谓的 “精密宇宙学” (Precision Cosmology)。
按照这种 “精密宇宙学” 为我们绘出的图景, 在宇宙目前的能量密度中暗能量约占 72%, 暗物质约占 24%, 而我们所熟悉的所谓可见物质只占可怜兮兮的 4% (参阅 宇宙学常数、超对称及膜宇宙论)。 在这些组成部分中, 对暗能量与暗物质的研究目前还处于一个很初级的阶段, 尚未建立足够具体且有实验基础的理论。 因此本文对之不做讨论。
除去了暗能量与暗物质, 剩下的就是可见物质了。 可见物质在宇宙能量密度中所占的比例虽小, 却是我们所熟知的物质世界的主体。 可观测宇宙中近千亿的星系, 每个星系中近千亿的恒星, 以及某个不起眼的恒星附近第三颗行星上数十亿的灵长类生物, 全都包含在了这小小的 4% 之中[注一]。
本文要讨论的便是这 4% 的可见物质。
与 “暗” 字打头的其余 96% 的能量密度相比, 我们对可见物质的研究与了解都要深入得多。 今天几乎每一位中学生都知道, 这部分物质主要是由质子、 中子、 电子等粒子组成的。 因此很明显, 要讨论质量的起源, 归根到底是要讨论这些粒子的质量起源。
三. 从机械观到电磁观
对几乎所有受过现代教育的人来说, 最早接触质量这一概念都是在 Newton 力学中。 在 Newton 力学中, 质量是决定物体惯性与引力的基本物理量, 是一个不可约的概念。 我们知道, Newton 力学在大约两百年的时间里被认为是描述物理世界的基本框架, 这是所谓的机械观。 在那段时间里, 物理学家们曾经试图把物理学的各个分支尽可能地约化为力学。 很显然, 在那样一个以机械观为主导的时期里, 质量既然是力学中的不可约概念, 自然也就成为了整个物理学中的不可约概念。 因此有关质量起源的研究在那个时期是基本不存在的[注二]。
对几乎所有受过现代教育的人来说, 最早接触质量这一概念都是在 Newton 力学中。 在 Newton 力学中, 质量是决定物体惯性与引力的基本物理量, 是一个不可约的概念。 我们知道, Newton 力学在大约两百年的时间里被认为是描述物理世界的基本框架, 这是所谓的机械观。 在那段时间里, 物理学家们曾经试图把物理学的各个分支尽可能地约化为力学。 很显然, 在那样一个以机械观为主导的时期里, 质量既然是力学中的不可约概念, 自然也就成为了整个物理学中的不可约概念。 因此有关质量起源的研究在那个时期是基本不存在的[注二]。
但是到了十九世纪末的时候, 那种试图把物理学其它分支约化为力学的努力遭到了很大的挫折。 这种挫折首先来自于电磁理论。 大家知道, 电磁理论预言了电磁波, 按照机械观, 波的传播必然有相应的介质。 但是电磁波是在什么介质中传播的呢? 却是谁也不知道。 尽管如此, 物理学家们还是按照机械观的思路假设了这种介质的存在, 并称之为 “以太”。 但不幸的是, 所有试图为以太构筑机械模型的努力全都在实验面前遭遇了滑铁卢。 在那段最终催生了狭义相对论的物理学阵痛期里, 许多物理学家艰难地试图调和着实验与机械以太模型之间的矛盾。 但与那些挽救机械观的努力同时, 一种与机械观截然相反的思路也萌发了起来, 那便是电磁观。 电磁观的思路是: 物理学上并没有什么先验的理由要求我们用力学的框架来描述自然, 机械观的产生只不过是因为力学在很长一个时期里是发展最为成熟的学科而已, 现在电磁理论也发展到了不亚于力学的成熟程度, 既然无法把电磁理论约化为力学, 那可不可以反过来把力学约化为电磁理论呢?
要想把力学约化为电磁理论, 关键就要把力学中不可约的质量概念约化为电磁概念, 这是物理学家们研究质量起源的第一种定量的尝试。 由于当时对物质的微观结构还知之甚少, 1897 年由 J. J. Thomson (1856-1940) 发现的电子是当时所知的唯一基本粒子, 因此将质量约化为电磁概念的努力就集中体现在了对电子的研究上, 由此产生了物理史上昙花一现的经典电子论。
四. 经典电子论
经典电子论最著名的人物是荷兰物理学家 H. A. Lorentz (1853-1928), 他是一位经典物理学的大师。 在相对论诞生之前的那几年里, Lorentz 虽已年届半百, 却依然才思敏捷。 1904 年他发表了一篇题为 “任意亚光速运动系统中的电磁现象” 的文章。 在这篇文章中他运用自己此前几年在研究运动系统的电磁理论时所提出的包括长度收缩、 局域时间 (local time) 在内的一系列假设, 计算了具有均匀面电荷分布的运动电子的电磁动量, 由此得到电子的横质量 mT 与纵质量 mL[注三] 分别为 (这里用的是 Gauss 单位制):
mT = (2/3)(e2/Rc2)γ; mL = (2/3)(e2/Rc2)γ3
其中 e 为电子的电荷, R 为电子在静止参照系中的半径, c 为光速, γ=(1-v2/c2)-1/2。 撇开系数不论, Lorentz 的这两个结果与后来的狭义相对论完全相同。 但 Lorentz 的文章一发表就遭到了经典电子论的另一位主要人物 M. Abraham (1875-1922) 的批评。 Abraham 指出, 质量除了象 Lorentz 那样通过动量来定义, 还应该可以通过能量来定义。 比方说纵质量可以定义为 mL=(1/v)(dE/dv)[注四]。 但是简单的计算表明, 用这种方法得到的质量与 Lorentz 的结果完全不同!
经典电子论最著名的人物是荷兰物理学家 H. A. Lorentz (1853-1928), 他是一位经典物理学的大师。 在相对论诞生之前的那几年里, Lorentz 虽已年届半百, 却依然才思敏捷。 1904 年他发表了一篇题为 “任意亚光速运动系统中的电磁现象” 的文章。 在这篇文章中他运用自己此前几年在研究运动系统的电磁理论时所提出的包括长度收缩、 局域时间 (local time) 在内的一系列假设, 计算了具有均匀面电荷分布的运动电子的电磁动量, 由此得到电子的横质量 mT 与纵质量 mL[注三] 分别为 (这里用的是 Gauss 单位制):
mT = (2/3)(e2/Rc2)γ; mL = (2/3)(e2/Rc2)γ3
其中 e 为电子的电荷, R 为电子在静止参照系中的半径, c 为光速, γ=(1-v2/c2)-1/2。 撇开系数不论, Lorentz 的这两个结果与后来的狭义相对论完全相同。 但 Lorentz 的文章一发表就遭到了经典电子论的另一位主要人物 M. Abraham (1875-1922) 的批评。 Abraham 指出, 质量除了象 Lorentz 那样通过动量来定义, 还应该可以通过能量来定义。 比方说纵质量可以定义为 mL=(1/v)(dE/dv)[注四]。 但是简单的计算表明, 用这种方法得到的质量与 Lorentz 的结果完全不同!
很明显, 这说明 Lorentz 的电子论有缺陷。 那么缺陷在哪里呢? Abraham 认为是 Lorentz 的计算忽略了为平衡电子电荷间的排斥所必需的张力。 没有这种张力, Lorentz 的电子会在各电荷元的相互排斥下土崩瓦解[注五]。 除 Abraham 外, 另一位经典物理学大师 H. Poincaré (1854-1912) 也注意到了 Lorentz 电子论的这一问题。 Poincaré 与 Lorentz 是 Einstein 之前在定量结果上最接近狭义相对论的物理学家。 不过比较而言, Lorentz 的工作更为直接, 为了调和以太理论与实验的矛盾, 他具体提出了许多新的假设, 而 Poincaré 往往是在从美学与哲学角度审视 Lorentz 及其他人的工作时对那些工作进行修饰及完善。
这也很符合这两人的特点, Lorentz 是一位第一流的工作型物理学家 (working physicist), 而 Poincaré 既是第一流的数学及物理学家, 又是第一流的科学哲学家。 1904 年至 1906 年间 Poincaré 亲自对 Lorentz 电子论进行了研究, 并定量地引进了为维持电荷平衡所需的张力, 这种张力因此而被称为 Poincaré 张力 (Poincaré stress)。 在 Poincaré 工作的基础上, 1911 年 (即在 Einstein 与 Minkowski 建立了狭义相对论的数学框架之后), 德国物理学家 M. von Laue (1879-1960) 证明了带有 Poincaré 张力的电子的能量动量具有正确的 Lorentz 变换规律。
下面我们用现代语言来简单叙述一下经典电子论有关电子结构的这些主要结果。 按照狭义相对论中最常用的约定, 我们引进两个惯性参照系: S 与 S', S' 相对于 S 沿 x 轴以速度 v 运动。 假定电子在 S 系中静止, 则在 S' 系中电子的动量为:
p'μ = ∫t'=0T'0μ(x'ξ)d3x' = L0αLμβ∫Tαβ(xξ)d3x'
其中 T 为电子的总能量动量张量, L 为 Lorentz 变换矩阵。 由于 S 系中 Tαβ 与 t 无关, 考虑到:
∫Tαβ(xξ)d3x' = ∫Tαβ(γx', y', z')d3x' = γ-1∫Tαβ(xξ)d3x
上式可以改写成:
p'μ = γ-1L0αLμβ∫Tαβ(xξ)d3x
由此得到电子的能量与动量分别为 (有兴趣的读者可以试着自行证明一下):
E = p'0 = γm + γ-1L0iL0j∫Tij(xξ)d3x
p = p'1 = γvm + γ-1L0iL1j∫Tij(xξ)d3x
这里 i, j 为空间指标 1, 2, 3, m=∫T00(xξ)d3x, 为了简化结果, 我们取 c=1。 显然, 由这两个式子的第一项所给出的能量动量是狭义相对论所需要的, 而 Lorentz 电子论的问题就在于当 Tμν 只包含纯电磁能量动量张量 TEMμν 时这两个式子的第二项非零[注六]。
那么 Poincaré 张力为什么能够避免 Lorentz 电子论的问题呢? 关键在于引进 Poincaré 张力后电子才成为一个满足力密度 fμ=∂νTμν=0 的孤立平衡体系。 在电子静止系 S 中 Tμν 不含时间, 因此 ∂jTij=0。 由此可以得到一个很有用的关系式 (请读者自行证明): ∂k(Tikxj)=Tij。 对这个式子做体积分, 注意到左边的积分为零, 便可得到:
∫Tij(xξ)d3x =0
这个结果被称为 Laue 定理, 它表明我们上面给出的电子能量动量表达式中的第二项为零。 因此 Poincaré 张力的引进非常漂亮地保证了电子能量动量的协变性。
p'μ = ∫t'=0T'0μ(x'ξ)d3x' = L0αLμβ∫Tαβ(xξ)d3x'
其中 T 为电子的总能量动量张量, L 为 Lorentz 变换矩阵。 由于 S 系中 Tαβ 与 t 无关, 考虑到:
∫Tαβ(xξ)d3x' = ∫Tαβ(γx', y', z')d3x' = γ-1∫Tαβ(xξ)d3x
上式可以改写成:
p'μ = γ-1L0αLμβ∫Tαβ(xξ)d3x
由此得到电子的能量与动量分别为 (有兴趣的读者可以试着自行证明一下):
E = p'0 = γm + γ-1L0iL0j∫Tij(xξ)d3x
p = p'1 = γvm + γ-1L0iL1j∫Tij(xξ)d3x
这里 i, j 为空间指标 1, 2, 3, m=∫T00(xξ)d3x, 为了简化结果, 我们取 c=1。 显然, 由这两个式子的第一项所给出的能量动量是狭义相对论所需要的, 而 Lorentz 电子论的问题就在于当 Tμν 只包含纯电磁能量动量张量 TEMμν 时这两个式子的第二项非零[注六]。
那么 Poincaré 张力为什么能够避免 Lorentz 电子论的问题呢? 关键在于引进 Poincaré 张力后电子才成为一个满足力密度 fμ=∂νTμν=0 的孤立平衡体系。 在电子静止系 S 中 Tμν 不含时间, 因此 ∂jTij=0。 由此可以得到一个很有用的关系式 (请读者自行证明): ∂k(Tikxj)=Tij。 对这个式子做体积分, 注意到左边的积分为零, 便可得到:
∫Tij(xξ)d3x =0
这个结果被称为 Laue 定理, 它表明我们上面给出的电子能量动量表达式中的第二项为零。 因此 Poincaré 张力的引进非常漂亮地保证了电子能量动量的协变性。
至此, 经过 Lorentz, Poincaré, Laue 等人的工作, 经典电子论似乎达到了一个颇为优美的境界, 既维持了电子的稳定性, 又满足了能量动量的协变性。 但事实上, 在这一系列工作完成时经典电子论对电子结构的描述已经处在了一个看似完善, 实则没落的境地。 这其中的一个原因便是那个 “非常漂亮地” 保证了电子能量动量协变性的 Poincaré 张力。 这个张力究竟是什么? 我们几乎一无所知。 更糟糕的是, 若真的完全一无所知倒也罢了, 我们却偏偏还知道一点, 那就是 Poincaré 张力必须是非电磁起源的, 而这恰恰是对电磁观的一种沉重打击。 就这样, 试图把质量约化为纯电磁概念的努力由于必须引进非电磁起源的 Poincaré 张力而化为了泡影。 但这对于很快到来的经典电子论及电磁观的整体没落来说还只是一个很次要的原因。
2-10楼的注释:
注释
1、当然, 这一说法并不严格, 在星系所占据的空间范围内也有数量可观的暗物质及暗能量, 我们这里指的只是光学观测意义上的星系。
2、这里有一个著名的例外是 E. Mach (1838-1916), 他对 Newton 绝对时空观的批判性思考启示了这样一种观念, 那就是一个物体的质量 (惯性) 起源于宇宙中其它星体的作用。 Mach 的想法曾对 Einstein 产生过影响, 并且直到现在还有一些物理学家在研究, 但是它与广义相对论的定量结果及对惯性各向异性的测量结果并不相符。 因此我们不把它列为有关质量起源的具体理论。
3、Lorentz 所用的质量定义是 m(dv/dt)=dp/dt, “横质量” 与 “纵质量” 分别对应于 v 与 dv/dt 垂直及平行这两种特殊情况。
4、当时还没有 Einstein 的质能关系式, Abraham 的这一关系式是一个简单的力学关系式, 读者不妨自行推导一下。
5、如上所述, Abraham 也是经典电子论的代表人物, 有的读者可能会问, 他自己的电子模型又如何呢? 与 Lorentz 不同, Abraham 所用的是一个绝对刚性的电子模型, 因此在他的模型中不需要引进对能量有贡献的张力。 他的模型一度曾被认为比 Lorentz 的模型更符合实验, 但那实验 - W. Kaufmann (1871-1947) 的实验 - 后来被证实是有缺陷的。
6、有兴趣的读者可以进一步证明这样一些结果: 1. 对于球对称均匀面电荷分布, ∫TEM00(xξ)d3x = (1/2)e2/R。 2. 对于球对称电荷分布, ∫TEMii(xξ)d3x = (1/3)∫TEM00(xξ)d3x。 3. 由 1 和 2 证明 Lorentz 有关 mT 与 mL 的公式。 4. 证实 Abraham 对 Lorentz 的批评, 即用 mL=(1/v)(dE/dv) 定义的质量与 Lorentz 的结果不同。
注释
1、当然, 这一说法并不严格, 在星系所占据的空间范围内也有数量可观的暗物质及暗能量, 我们这里指的只是光学观测意义上的星系。
2、这里有一个著名的例外是 E. Mach (1838-1916), 他对 Newton 绝对时空观的批判性思考启示了这样一种观念, 那就是一个物体的质量 (惯性) 起源于宇宙中其它星体的作用。 Mach 的想法曾对 Einstein 产生过影响, 并且直到现在还有一些物理学家在研究, 但是它与广义相对论的定量结果及对惯性各向异性的测量结果并不相符。 因此我们不把它列为有关质量起源的具体理论。
3、Lorentz 所用的质量定义是 m(dv/dt)=dp/dt, “横质量” 与 “纵质量” 分别对应于 v 与 dv/dt 垂直及平行这两种特殊情况。
4、当时还没有 Einstein 的质能关系式, Abraham 的这一关系式是一个简单的力学关系式, 读者不妨自行推导一下。
5、如上所述, Abraham 也是经典电子论的代表人物, 有的读者可能会问, 他自己的电子模型又如何呢? 与 Lorentz 不同, Abraham 所用的是一个绝对刚性的电子模型, 因此在他的模型中不需要引进对能量有贡献的张力。 他的模型一度曾被认为比 Lorentz 的模型更符合实验, 但那实验 - W. Kaufmann (1871-1947) 的实验 - 后来被证实是有缺陷的。
6、有兴趣的读者可以进一步证明这样一些结果: 1. 对于球对称均匀面电荷分布, ∫TEM00(xξ)d3x = (1/2)e2/R。 2. 对于球对称电荷分布, ∫TEMii(xξ)d3x = (1/3)∫TEM00(xξ)d3x。 3. 由 1 和 2 证明 Lorentz 有关 mT 与 mL 的公式。 4. 证实 Abraham 对 Lorentz 的批评, 即用 mL=(1/v)(dE/dv) 定义的质量与 Lorentz 的结果不同。
五. 量子电动力学
经典电子论的没落是物理学史上最富宿命色彩的事件。 这一宿命的由来是因为电子发现得太晚, 而量子理论又出现得太早, 这就注定了夹在其间, 因 “电子” 而始、 逢 “量子” 而终的经典电子论只能有一个昙花一现的命运[注一]。 为它陪葬而终还有建立在经典电动力学基础上的整个电磁观。
经典电子论的没落是物理学史上最富宿命色彩的事件。 这一宿命的由来是因为电子发现得太晚, 而量子理论又出现得太早, 这就注定了夹在其间, 因 “电子” 而始、 逢 “量子” 而终的经典电子论只能有一个昙花一现的命运[注一]。 为它陪葬而终还有建立在经典电动力学基础上的整个电磁观。
量子理论对经典物理学的冲击是全方位的, 足可写成一部壮丽的史诗。 就经典电子论中有关电子结构的部分而言, 对这种冲击最简单的描述来自于测不准原理。 如我们在 上一节 中看到的, 经典电子论给出的电子质量 - 除去一个与电荷分布有关的数量级为 1 的因子 - 约为 e2/Rc2。 由此可以很容易地估算出 R~10-15 米 (感兴趣的读者请自行验证一下)。 这一数值被称为电子的经典半径。 但是从测不准原理的角度看, 对电子空间定位的精度只能达到电子的 Compton 波长 h/mc~R/α~10-12 米的量级 (其中 α≈1/137 为精细结构常数), 把电子视为经典电荷分布的做法只有在空间尺度远大于这一量级的情形下才适用。 由于电子的经典半径远远小于这一尺度, 这表明经典电子论并不适用于描述电子的结构。 建立在经典电子论基础上的电子质量计算也因此而失去了理论基础[注二]。
但是经典电子论对电子质量的计算虽然随着量子理论的出现而丧失了理论基础, 那种计算所体现的自相互作用对电子质量产生贡献的思想却是合理的, 并在量子理论中得到了保留。 这种贡献被称为电子自能。 在量子理论基础上对电子自能的计算最早是由 I. Waller 于 1930 年在单电子 Dirac 理论的基础上给出的, 结果随虚光子动量的平方而发散。 1934 年 V. Weisskopf (1908-2002) 计算了 Dirac 空穴理论 (hole theory) 下的电子自能, 结果发现其发散速度比 Waller 给出的慢得多, 只随虚光子动量的对数而发散[注三]。 撇开当时那些计算所具有的诸多缺陷不论, Weisskopf 的这一结果在定性上与现代量子场论一致。
按照现代量子场论, 相互作用对电子自能的贡献可以用对电子传播子产生贡献的单粒子不可约图 (one-particle irreducible diagrams) 来描述, 其中主要部分来自于由量子电动力学 (QED) 所描述的电磁自能, 而电磁自能中最简单的贡献则来自于右图所示的单圈图。 幸运的是, 由于量子电动力学的耦合常数在所有实验所及的能区都很小, 因此这个最简单的单圈图的贡献在整个电子自能中占主要部分[注四]。
对这一单圈图的计算在任何一本量子场论教材中都有详细介绍, 其结果为 δm~αmln(∧/m), 其中 m 为出现在量子电动力学 Lagrangian 中的电子质量参数, 被称为裸质量, ∧ 为虚光子动量的 cut-off。 如果我们把量子电动力学的适用范围无限外推, 允许虚光子具有任意大的动量, 则 δm 将趋于无穷, 这便是自二十世纪三四十年代起困扰物理学界几十年之久的量子场论发散困难的一个例子。
量子场论中的发散困难, 究其根本是由所谓的点粒子模型引起的。 这种发散具有相当的普遍性, 不单单出现在量子场论中。 将经典电子论运用于点电子模型同样会出现发散, 这一点从经典电子质量公式 m~e2/Rc2 中可以清楚地看到: 当电子半径 R 趋于零时质量 m 趋于无穷。 经典电子论通过引进电子的有限半径 (从而放弃点粒子模型) 免除了这一发散, 但伴随而来的 Poincaré 张力、 电荷分布等概念却在很大程度上使电子丧失了基本粒子所应有的简单性[注五]。 这种简单性虽然没有先验的理由, 但毫无疑问是人们引进基本粒子这一概念时怀有的一种美学上的期待, 正如 Dirac 所说: “电子太简单, 支配其结构的定律根本不应该成为问题”。 经典电子论将质量约化为电磁概念的努力即便在其它方面都成功了, 其意义也将由于引进电子半径这一额外参数及 Poincaré 张力、 电荷分布等额外假设而大为失色。 从这一角度上讲, 量子电动力学在概念约化上比经典电子论显得更为彻底, 因为在量子电动力学的 Lagrangian 中不含任何与基本粒子结构有关的几何参数。 基本粒子在量子场论中是以点粒子的形式出现的, 虽然这并不意味着它们不具有唯象意义上的等效结构, 但所有那些结构都是作为理论的结果而不是如经典电子论中那样作为额外假设而出现的, 这是除与狭义相对论及量子理论同时兼容, 与实验高度相符之外, 建立在点粒子模型基础上的量子场论又一个明显优于经典电子论的地方。
量子场论中的发散困难, 究其根本是由所谓的点粒子模型引起的。 这种发散具有相当的普遍性, 不单单出现在量子场论中。 将经典电子论运用于点电子模型同样会出现发散, 这一点从经典电子质量公式 m~e2/Rc2 中可以清楚地看到: 当电子半径 R 趋于零时质量 m 趋于无穷。 经典电子论通过引进电子的有限半径 (从而放弃点粒子模型) 免除了这一发散, 但伴随而来的 Poincaré 张力、 电荷分布等概念却在很大程度上使电子丧失了基本粒子所应有的简单性[注五]。 这种简单性虽然没有先验的理由, 但毫无疑问是人们引进基本粒子这一概念时怀有的一种美学上的期待, 正如 Dirac 所说: “电子太简单, 支配其结构的定律根本不应该成为问题”。 经典电子论将质量约化为电磁概念的努力即便在其它方面都成功了, 其意义也将由于引进电子半径这一额外参数及 Poincaré 张力、 电荷分布等额外假设而大为失色。 从这一角度上讲, 量子电动力学在概念约化上比经典电子论显得更为彻底, 因为在量子电动力学的 Lagrangian 中不含任何与基本粒子结构有关的几何参数。 基本粒子在量子场论中是以点粒子的形式出现的, 虽然这并不意味着它们不具有唯象意义上的等效结构, 但所有那些结构都是作为理论的结果而不是如经典电子论中那样作为额外假设而出现的, 这是除与狭义相对论及量子理论同时兼容, 与实验高度相符之外, 建立在点粒子模型基础上的量子场论又一个明显优于经典电子论的地方。
至于由此产生的发散困难, 在二十世纪七十年代之后得到了较为系统的解决, 有关这一解决方法 - 被称为重整化方法 - 的详细介绍, 我将在今后另文叙述。 不过尽管重整化方法无论在数学计算还是物理意义的理解上都已相当成熟, 但发散结果的存在基本上消除了传统量子场论成为所谓 “终极理论” (Theory of Everything) 的可能性, 这是后话。
六. 质量电磁起源的破灭
既然量子电动力学与经典电子论一样具有电子自能, 那么它能否代替经典电子论实现后者没能实现的把质量完全约化为电磁概念的梦想呢? 答案是否定的。
这可以从两方面看出。 首先从 δm~αmln(∧/m) 中的 αln(∧/m) 部分可以看到, 由于 α≈1/137 是一个很小的数目, 而 ln(∧/m) 又是一个增长极其缓慢的函数, 因此对于任何 Planck 能标以下的 cut-off, 由电磁自能产生的质量修正与所谓的裸质量 m 相比都只占一个很小的比例[注六]。
另一方面, 即使我们一厢情愿地把量子电动力学的适用范围延伸到比 Planck 能标还高得多的能区, 从而使 δm 变得很大, 把质量完全约化为电磁概念的梦想依然无法实现。 因为电子的电磁自能还有一个要命的特点, 那就是 δm∝m。 这表明, 无论把 cut-off 取得多大, 如果裸质量为零, 电子的电磁自能也将为零。 而裸质量是量子电动力学 Lagrangian 中的参数, 在量子电动力学的范围之内是无法约化的。
有的读者可能会问: 电磁自能既然是由电磁相互作用引起的, 理应只与电荷有关, 为什么却会正比于裸质量呢? 这其中的奥妙在于对称性。 量子电动力学的 Lagrangian:
L = -(1/4)FμνFμν + ψ(iγμ∂μ-m)ψ -eψγμAμψ
在 m=0 的时候具有一种额外的对称性, 即在 ψ→eiαγ5ψ 下不变 (请有兴趣的读者自行证明)。 这种对称性被称为手征对称性 (chiral symmetry), 它表明在 m=0 的情形下电子的左右手征态:
既然量子电动力学与经典电子论一样具有电子自能, 那么它能否代替经典电子论实现后者没能实现的把质量完全约化为电磁概念的梦想呢? 答案是否定的。
这可以从两方面看出。 首先从 δm~αmln(∧/m) 中的 αln(∧/m) 部分可以看到, 由于 α≈1/137 是一个很小的数目, 而 ln(∧/m) 又是一个增长极其缓慢的函数, 因此对于任何 Planck 能标以下的 cut-off, 由电磁自能产生的质量修正与所谓的裸质量 m 相比都只占一个很小的比例[注六]。
另一方面, 即使我们一厢情愿地把量子电动力学的适用范围延伸到比 Planck 能标还高得多的能区, 从而使 δm 变得很大, 把质量完全约化为电磁概念的梦想依然无法实现。 因为电子的电磁自能还有一个要命的特点, 那就是 δm∝m。 这表明, 无论把 cut-off 取得多大, 如果裸质量为零, 电子的电磁自能也将为零。 而裸质量是量子电动力学 Lagrangian 中的参数, 在量子电动力学的范围之内是无法约化的。
有的读者可能会问: 电磁自能既然是由电磁相互作用引起的, 理应只与电荷有关, 为什么却会正比于裸质量呢? 这其中的奥妙在于对称性。 量子电动力学的 Lagrangian:
L = -(1/4)FμνFμν + ψ(iγμ∂μ-m)ψ -eψγμAμψ
在 m=0 的时候具有一种额外的对称性, 即在 ψ→eiαγ5ψ 下不变 (请有兴趣的读者自行证明)。 这种对称性被称为手征对称性 (chiral symmetry), 它表明在 m=0 的情形下电子的左右手征态:
ψL = (1-γ5)/2 ψ, ψR = (1+γ5)/2 ψ
不会互相耦合。 另一方面, (读者可以很容易地证明) 电子的质量项
mψψ = mψLψR + mψRψL
却是一个电子左右手征态相互耦合, 从而破坏手征对称性的项。 这样的项在电子的裸质量不存在 - 从而量子电动力学的 Lagrangian 具有手征对称性 - 的情况下将被手征对称性所禁止, 不可能出现在任何微扰修正中。 因此 δm∝mln(∧/m) 这一结果的出现是很自然的[注七]。
至此我们看到, 试图把质量完全归因于电磁相互作用的想法在量子场论中彻底地破灭了。 电磁质量即使在象电子这样质量最小 - 从某种意义上讲也最为纯粹 - 的带电粒子的质量中也只占一个不大的比例, 在其它粒子 - 尤其是那些不带电荷的基本粒子 - 中就更甭提了。
很显然, 质量的主要来源必须到别处去寻找。
不会互相耦合。 另一方面, (读者可以很容易地证明) 电子的质量项
mψψ = mψLψR + mψRψL
却是一个电子左右手征态相互耦合, 从而破坏手征对称性的项。 这样的项在电子的裸质量不存在 - 从而量子电动力学的 Lagrangian 具有手征对称性 - 的情况下将被手征对称性所禁止, 不可能出现在任何微扰修正中。 因此 δm∝mln(∧/m) 这一结果的出现是很自然的[注七]。
至此我们看到, 试图把质量完全归因于电磁相互作用的想法在量子场论中彻底地破灭了。 电磁质量即使在象电子这样质量最小 - 从某种意义上讲也最为纯粹 - 的带电粒子的质量中也只占一个不大的比例, 在其它粒子 - 尤其是那些不带电荷的基本粒子 - 中就更甭提了。
很显然, 质量的主要来源必须到别处去寻找。
12-20楼解释:
1、当然这样的说法对历史作了相当大的简化, 确切地讲经典电子论的出现实际上略早于电子的发现, 而类似于经典电子论的电子结构研究在量子理论之后仍然有一些物理学家在做, 比较著名的有 Dirac, Wheeler 及 Feynman (不过这些研究已不能完全归于经典电子论的范畴)。 另一方面, 经典电子论所包含的电子结构以外的东西, 比如从物质的微观电结构出发研究宏观电磁及光学现象的方法直到今天还可以在一些电磁学教材中找到踪迹。 但是经典电子论随着量子理论的兴盛而没落的大趋势是显而易见的。
2、经典电子论对电子的描述不仅与量子力学不符, 在电子自旋发现之后, 试图在经典电子模型中加入电子自旋的努力与狭义相对论也产生了矛盾, 可谓腹背受敌。
3、Weisskopf 的计算中包含了一个符号错误, 但很快被 W. H. Furry 和 F. J. Carlson 所纠正。
4、量子场论的微扰展开式有许多微妙的地方。 以量子电动力学为例, 尽管其耦合常数 α 很小, 从而 n 圈图的贡献受到 αn 的抑制, 但另一方面, 随着圈数的增加, 不等价 n 圈图的数目也在增加, 其趋势约为 n! (这是非常粗略的说法, 圈图的确切数目与相互作用的具体形式有关, 且其中还有符号问题, 综合的结果非常复杂)。 当 n~1/α 时圈图数量的增加将抵消由弱耦合所带来的减弱因子 αn 的影响, 因此量子电动力学的微扰展开式并不收敛, 这一点最早是由 F. Dyson (1923-) 于 1951 年给出的 (不过 Dyson 的论述方法与上面不同, 感兴趣的读者可以参阅本文末尾的 附录)。 有鉴于此, 所谓单圈图的贡献占主要部分其实是从渐近级数的意义上说的。
4、顺便提一下, Poincaré 张力带来的困难除了我们在 第四节 中提到的非电磁起源外, 还有一个更严重的, 那就是由 Poincaré 张力所维持的电子结构虽然具有静态平衡, 却是不稳定的, 类似于 Einstein 的静态宇宙模型。 这是 1922 年由 E. Fermi (1901-1954) 所证明的。
5、当我们谈到 cut-off 的时候, 比如在本文中或者在 “宇宙学常数、 超对称及膜宇宙论” 的 第四节 中讨论零点能时, 有一点需要提醒读者注意。 那就是对于象电子自能或宇宙学常数这样对 cut-off 的数值相对敏感的物理量, 只计算 cut-off 以下的贡献显然是不完整的, 那么来自 cut-off 以上的贡献有多少呢? 答案是与在 cut-off 以上仍然适用的理论的具体形式有关。 如果那个理论仍有 cut-off, 我们还必须关心来自新的 cut-off 以上的贡献有多少 。。。 物理学家们的期望是, 我们最终将会有一个有限的理论, 那时我们就不需要用 cut-off 来遮遮掩掩了。
6、这从简单的量纲分析就可以看出: δm 的形式为 mf(∧/m), 而从 Feynman 图所对应的积分的形式可知其相对于 ∧ 的渐近形式 f(x) 只能是对数或正负整数幂函数, 这其中只有 f(x)=ln(x) 可以使 δm 既在 ∧→∞ 时发散, 又在 m→0 时为零。
1、当然这样的说法对历史作了相当大的简化, 确切地讲经典电子论的出现实际上略早于电子的发现, 而类似于经典电子论的电子结构研究在量子理论之后仍然有一些物理学家在做, 比较著名的有 Dirac, Wheeler 及 Feynman (不过这些研究已不能完全归于经典电子论的范畴)。 另一方面, 经典电子论所包含的电子结构以外的东西, 比如从物质的微观电结构出发研究宏观电磁及光学现象的方法直到今天还可以在一些电磁学教材中找到踪迹。 但是经典电子论随着量子理论的兴盛而没落的大趋势是显而易见的。
2、经典电子论对电子的描述不仅与量子力学不符, 在电子自旋发现之后, 试图在经典电子模型中加入电子自旋的努力与狭义相对论也产生了矛盾, 可谓腹背受敌。
3、Weisskopf 的计算中包含了一个符号错误, 但很快被 W. H. Furry 和 F. J. Carlson 所纠正。
4、量子场论的微扰展开式有许多微妙的地方。 以量子电动力学为例, 尽管其耦合常数 α 很小, 从而 n 圈图的贡献受到 αn 的抑制, 但另一方面, 随着圈数的增加, 不等价 n 圈图的数目也在增加, 其趋势约为 n! (这是非常粗略的说法, 圈图的确切数目与相互作用的具体形式有关, 且其中还有符号问题, 综合的结果非常复杂)。 当 n~1/α 时圈图数量的增加将抵消由弱耦合所带来的减弱因子 αn 的影响, 因此量子电动力学的微扰展开式并不收敛, 这一点最早是由 F. Dyson (1923-) 于 1951 年给出的 (不过 Dyson 的论述方法与上面不同, 感兴趣的读者可以参阅本文末尾的 附录)。 有鉴于此, 所谓单圈图的贡献占主要部分其实是从渐近级数的意义上说的。
4、顺便提一下, Poincaré 张力带来的困难除了我们在 第四节 中提到的非电磁起源外, 还有一个更严重的, 那就是由 Poincaré 张力所维持的电子结构虽然具有静态平衡, 却是不稳定的, 类似于 Einstein 的静态宇宙模型。 这是 1922 年由 E. Fermi (1901-1954) 所证明的。
5、当我们谈到 cut-off 的时候, 比如在本文中或者在 “宇宙学常数、 超对称及膜宇宙论” 的 第四节 中讨论零点能时, 有一点需要提醒读者注意。 那就是对于象电子自能或宇宙学常数这样对 cut-off 的数值相对敏感的物理量, 只计算 cut-off 以下的贡献显然是不完整的, 那么来自 cut-off 以上的贡献有多少呢? 答案是与在 cut-off 以上仍然适用的理论的具体形式有关。 如果那个理论仍有 cut-off, 我们还必须关心来自新的 cut-off 以上的贡献有多少 。。。 物理学家们的期望是, 我们最终将会有一个有限的理论, 那时我们就不需要用 cut-off 来遮遮掩掩了。
6、这从简单的量纲分析就可以看出: δm 的形式为 mf(∧/m), 而从 Feynman 图所对应的积分的形式可知其相对于 ∧ 的渐近形式 f(x) 只能是对数或正负整数幂函数, 这其中只有 f(x)=ln(x) 可以使 δm 既在 ∧→∞ 时发散, 又在 m→0 时为零。
七. 对称性自发破缺
在质量的电磁起源破灭后, 质量起源问题沉寂了很长一段时间。 但物理学本身的前进步伐并未因此而稍有停顿。 物理学家们手头有大量的观测数据需要分析解释, 同时理论体系本身也有大量的问题亟待解决。 对现代物理学的发展来说, 这些是远比解决象质量起源之类的本原问题更重要的动力。 但是现代物理学在研究那些细节问题中逐渐积累起来的智慧与洞见, 却常常会为更深入地探求本原问题提供新的思路。 这是现代物理学的卓越之处, 也是她没有象那些只注重于深奥的本原问题, 却对细节不屑一顾的其它尝试那样流于肤浅的重要原因。
物理学再次回到质量起源问题是在二十世纪六十年代。
在二十世纪六十年代初的时侯, 物理学家们在对基本粒子的研究中已经发现了许多对称性。 对称性在物理学中一直有着重要的地位, 不仅由于其优美的形式与物理学家们对自然规律的美学追求十分吻合, 更重要的是因为它不仅中看, 而且中用, 有一种穿透复杂性的力量。 即使在对体系动力学行为还没有透彻理解的情况下, 对称性也往往具有令人瞩目的预言能力。 这最后一点在二十世纪五六十年代的粒子物理研究中具有极大的吸引力, 因为当时人们对基本粒子相互作用的动力学机制知之甚少, 而且对在很大程度上为研究基本粒子相互作用而发展起来的量子场论产生了很深的怀疑 (详见本人的译作 规范理论的重整化)。 在这种情况下, 许多物理学家对对称性寄予了厚望, 希望通过它们来窥视大自然在这一层次上的奥秘。
但不幸的是, 当时所发现的许多对称性却被证明只在近似的情况下才成立, 比如同位旋对称性与宇称对称性。 如何理解这种近似对称性呢? 当时有一种猜测, 认为近似对称性是 (严格) 对称性自发破缺的产物。
在质量的电磁起源破灭后, 质量起源问题沉寂了很长一段时间。 但物理学本身的前进步伐并未因此而稍有停顿。 物理学家们手头有大量的观测数据需要分析解释, 同时理论体系本身也有大量的问题亟待解决。 对现代物理学的发展来说, 这些是远比解决象质量起源之类的本原问题更重要的动力。 但是现代物理学在研究那些细节问题中逐渐积累起来的智慧与洞见, 却常常会为更深入地探求本原问题提供新的思路。 这是现代物理学的卓越之处, 也是她没有象那些只注重于深奥的本原问题, 却对细节不屑一顾的其它尝试那样流于肤浅的重要原因。
物理学再次回到质量起源问题是在二十世纪六十年代。
在二十世纪六十年代初的时侯, 物理学家们在对基本粒子的研究中已经发现了许多对称性。 对称性在物理学中一直有着重要的地位, 不仅由于其优美的形式与物理学家们对自然规律的美学追求十分吻合, 更重要的是因为它不仅中看, 而且中用, 有一种穿透复杂性的力量。 即使在对体系动力学行为还没有透彻理解的情况下, 对称性也往往具有令人瞩目的预言能力。 这最后一点在二十世纪五六十年代的粒子物理研究中具有极大的吸引力, 因为当时人们对基本粒子相互作用的动力学机制知之甚少, 而且对在很大程度上为研究基本粒子相互作用而发展起来的量子场论产生了很深的怀疑 (详见本人的译作 规范理论的重整化)。 在这种情况下, 许多物理学家对对称性寄予了厚望, 希望通过它们来窥视大自然在这一层次上的奥秘。
但不幸的是, 当时所发现的许多对称性却被证明只在近似的情况下才成立, 比如同位旋对称性与宇称对称性。 如何理解这种近似对称性呢? 当时有一种猜测, 认为近似对称性是 (严格) 对称性自发破缺的产物。
所谓对称性自发破缺, 指的是这样一种情形: 即一个物理体系的 Lagrangian 具有某种对称性, 而基态却不具有该对称性。 换句话说体系的基态破缺了运动方程所具有的对称性。 这种对称性自发破缺的概念最早出现在凝聚态物理中, 二十世纪六十年代被 Y. Nambu (1921–) 与 G. Jona-Lasinio (1932-) 引进到量子场论中。 在量子场论中, 体系的基态是真空态, 因此对称性自发破缺表现为体系 Lagrangian 所具有的对称性被真空态所破缺。
但是把近似对称性归因于对称性自发破缺的想法在 1961 年遭到了致命的打击。 那一年由 J. Goldstone (1933-) 提出并在稍后与 A. Salam (1926-1996) 及 S. Weinberg (1933-) 一起证明了这样一个命题 (被称为 Goldstone 定理): 每一个自发破缺的整体连续对称性都必然伴随一个无质量标量粒子 (被称为 Goldstone 粒子或 Nambu-Goldstone 粒子)。
为什么会有这样的结果呢? 我们来简单地证明一下:
假定 Lagrangian 中的势函数为 V(φa) (a=1, ..., N), 其中 φa 为标量场 (可以是基本的也可以是复合的)。 显然这一体系的真空态满足 (∂V/∂φa)=0, 而标量粒子的质量 (平方) 由 (∂2V/∂φa∂φb) 在真空态上的本征值给出。 现在考虑对真空态 φa 作一个无穷小连续对称变换 φa → φa+εΔa(φ) (其中 ε 为无穷小参数)。 由于 V(φa) 在这一变换下不变 (请读者想一想这是为什么?), 因此有: Δa(φ)(∂V/∂φa)=0。 将这一表达式对 φb 作一次导数, 并注意到真空所满足的条件, 可得 (请读者自行证明):
Δa(φ) (∂2V/∂φa∂φb) = 0
由上式可以看到, 每一个 Δa(φ)≠0 的连续对称变换都对应于 (∂2V/∂φa∂φb) 的一个本征值为零的本征态, 从而也就对应于一个无质量标量粒子。 而 Δa(φ)≠0 的连续对称变换所对应的正是那些不能使真空态不变 - 从而被真空态所破缺 (即自发破缺) - 的连续对称性。 这就证明了每一个自发破缺的整体连续对称性都必然伴随一个无质量标量粒子, 即 Goldstone 粒子。 这正是 Goldstone 定理 (请读者思考一下, Goldstone 定理中的 “整体” 二字体现在证明的什么地方?)[注二]。 由于自发破缺的整体连续对称性的数目等于这些对称性的生成元数目, 因此 Goldstone 定理表明 Goldstone 粒子的数目等于自发破缺的整体连续对称性的生成元数目。 举个例子来说, SU(2) 对称性具有三个生成元, 若完全破缺, 就会产生三个 Goldstone 粒子; 若破缺为 U(1), 则只产生两个 Goldstone 粒子 (因为有一个生成元未破缺)。 进一步的分析还表明, Goldstone 粒子与那些自发破缺的整体连续对称性所对应的荷 (请读者回忆一下 Noether 定理) 具有相同的宇称及内禀量子数。
为什么会有这样的结果呢? 我们来简单地证明一下:
假定 Lagrangian 中的势函数为 V(φa) (a=1, ..., N), 其中 φa 为标量场 (可以是基本的也可以是复合的)。 显然这一体系的真空态满足 (∂V/∂φa)=0, 而标量粒子的质量 (平方) 由 (∂2V/∂φa∂φb) 在真空态上的本征值给出。 现在考虑对真空态 φa 作一个无穷小连续对称变换 φa → φa+εΔa(φ) (其中 ε 为无穷小参数)。 由于 V(φa) 在这一变换下不变 (请读者想一想这是为什么?), 因此有: Δa(φ)(∂V/∂φa)=0。 将这一表达式对 φb 作一次导数, 并注意到真空所满足的条件, 可得 (请读者自行证明):
Δa(φ) (∂2V/∂φa∂φb) = 0
由上式可以看到, 每一个 Δa(φ)≠0 的连续对称变换都对应于 (∂2V/∂φa∂φb) 的一个本征值为零的本征态, 从而也就对应于一个无质量标量粒子。 而 Δa(φ)≠0 的连续对称变换所对应的正是那些不能使真空态不变 - 从而被真空态所破缺 (即自发破缺) - 的连续对称性。 这就证明了每一个自发破缺的整体连续对称性都必然伴随一个无质量标量粒子, 即 Goldstone 粒子。 这正是 Goldstone 定理 (请读者思考一下, Goldstone 定理中的 “整体” 二字体现在证明的什么地方?)[注二]。 由于自发破缺的整体连续对称性的数目等于这些对称性的生成元数目, 因此 Goldstone 定理表明 Goldstone 粒子的数目等于自发破缺的整体连续对称性的生成元数目。 举个例子来说, SU(2) 对称性具有三个生成元, 若完全破缺, 就会产生三个 Goldstone 粒子; 若破缺为 U(1), 则只产生两个 Goldstone 粒子 (因为有一个生成元未破缺)。 进一步的分析还表明, Goldstone 粒子与那些自发破缺的整体连续对称性所对应的荷 (请读者回忆一下 Noether 定理) 具有相同的宇称及内禀量子数。
严格地讲, 上面的证明只是在所谓经典层次上的证明, 没有考虑量子修正。 那么考虑了量子修正后, Goldstone 定理是否还成立呢? 答案是肯定的, 而且证明也基本一样, 只需用包含量子修正的所谓量子有效势 Veff 取代经典 Lagrangian 中的势函数 V 即可[注三]。
由 Goldstone 等人证明的这一结果为什么会对把近似对称性归因于对称性自发破缺的想法造成致命打击呢? 原因很简单, 那就是近似对称性中有一些正是整体连续对称性 (比如同位旋对称性), 如果它们果真来源于对称性自发破缺的话, 那就应该存在相应的无质量标量粒子。 但我们从未在实验上观测到任何这样的粒子。 因此对称性自发破缺的想法在粒子物理学中由于牵涉到无质量粒子而陷入了困境。
由 Goldstone 等人证明的这一结果为什么会对把近似对称性归因于对称性自发破缺的想法造成致命打击呢? 原因很简单, 那就是近似对称性中有一些正是整体连续对称性 (比如同位旋对称性), 如果它们果真来源于对称性自发破缺的话, 那就应该存在相应的无质量标量粒子。 但我们从未在实验上观测到任何这样的粒子。 因此对称性自发破缺的想法在粒子物理学中由于牵涉到无质量粒子而陷入了困境。
八. 从 Higgs 机制到电弱统一理论
无独有偶, 粒子物理学中产生于五六十年代的另一个很高明的想法也受到了无质量粒子的困扰, 那便是 1954 年由 C. N. Yang (1922-) 和 R. Mills (1927-1999) 提出, 现在被称为 Yang-Mills 理论的定域 non-Abelian 规范理论。 这种理论是对 QED 所具有的定域 U(1) 规范对称性的推广, 最初是想用来描述同位旋对称性。 但它立刻就遇到了一个很大的困难, 那便是这种理论所具有的定域规范不变性会无可避免地导致无质量的矢量粒子 (被称为规范粒子, 类似于 QED 中的光子), 而在现实中, 除光子外我们从未在实验上观测到任何这样的无质量矢量粒子。
就这样, Yang-Mills 理论与对称性自发破缺这两个出色的想法先后搁浅了, 推根溯源, 都是无质量粒子惹的祸。 但如果我们仔细研究一下这对难兄难弟的病根, 就会发现两者竟然象是互为解药! 对称性自发破缺的问题出在哪里呢? 出在整体连续对称性上; 而 Yang-Mills 理论的问题又出在哪里呢? 出在定域规范对称性 (那是一种特殊的定域连续对称性) 上。 如果我们把这两者放在一起, 让对称性自发破缺干掉那些产生无质量矢量粒子的定域规范对称性, Yang-Mills 理论不就可以摆脱困境了吗? 更妙的是, 由于 Yang-Mills 理论中的对称性不是整体而是定域的, Goldstone 定理将不适用于这种对称性的自发破缺, 这样一来说不定那些可恶的 Goldstone 粒子也会消失, 那岂不是两全其美? 世界上会有这么好的事吗? 还真的有。
最早明确指出这一点的是美国凝聚态物理学家 P. Anderson (1923-)。 对于 Anderson 来说, Goldstone 定理显然不可能是普遍成立的, 因为当时人们就已经知道超导体是一个连续对称性 - U(1) 对称性 - 自发破缺的体系, 但在这一破缺过程中并没有产生无质量的 Goldstone 粒子。 Anderson 很正确地意识到 U(1) 对称性的定域特点是使 Goldstone 定理失效的关键。 由于并非只有定域 U(1) 对称性具有定域特点, 事实上所有杨-米尔斯理论也都具有这一特点。 因此 Anderson 在 1963 年猜测道: “Goldstone 的零质量困难并不是一个严重的困难, 因为我们很可能可以用一个相应的 Yang-Mills 零质量问题来消去它”。 Anderson 的想法得到了一些物理学家的认同, 但也有人认为这种凝聚态物理的类比不能应用到相对论量子场论中。 这一怀疑很快就被推翻了。 1964 年, 英国物理学家 P. Higgs (1929-)、 比利时物理学家 F. Englert 与 R. Brout 等几乎同时证实了 Anderson 的想法。 这便是描述规范对称性自发破缺的著名的 Higgs 机制[注四]。
不过 Higgs 等人的漂亮工作并没有引起立即的轰动。 Higgs 就这一工作所写的两篇短文的第二篇甚至一度遭到退稿, 理由是 “与物理世界没有明显关系”。 这一退稿理由使 Higgs 深感不快, 但也促使他更深入地考虑了理论可能带来的实验结果, 并对论文进行了补充。 Higgs 后来认为, 他因遭到退稿而偶然添加的那些内容是人们将 Higgs 粒子及 Higgs 机制与他的名字联系在一起的主要原因。
无独有偶, 粒子物理学中产生于五六十年代的另一个很高明的想法也受到了无质量粒子的困扰, 那便是 1954 年由 C. N. Yang (1922-) 和 R. Mills (1927-1999) 提出, 现在被称为 Yang-Mills 理论的定域 non-Abelian 规范理论。 这种理论是对 QED 所具有的定域 U(1) 规范对称性的推广, 最初是想用来描述同位旋对称性。 但它立刻就遇到了一个很大的困难, 那便是这种理论所具有的定域规范不变性会无可避免地导致无质量的矢量粒子 (被称为规范粒子, 类似于 QED 中的光子), 而在现实中, 除光子外我们从未在实验上观测到任何这样的无质量矢量粒子。
就这样, Yang-Mills 理论与对称性自发破缺这两个出色的想法先后搁浅了, 推根溯源, 都是无质量粒子惹的祸。 但如果我们仔细研究一下这对难兄难弟的病根, 就会发现两者竟然象是互为解药! 对称性自发破缺的问题出在哪里呢? 出在整体连续对称性上; 而 Yang-Mills 理论的问题又出在哪里呢? 出在定域规范对称性 (那是一种特殊的定域连续对称性) 上。 如果我们把这两者放在一起, 让对称性自发破缺干掉那些产生无质量矢量粒子的定域规范对称性, Yang-Mills 理论不就可以摆脱困境了吗? 更妙的是, 由于 Yang-Mills 理论中的对称性不是整体而是定域的, Goldstone 定理将不适用于这种对称性的自发破缺, 这样一来说不定那些可恶的 Goldstone 粒子也会消失, 那岂不是两全其美? 世界上会有这么好的事吗? 还真的有。
最早明确指出这一点的是美国凝聚态物理学家 P. Anderson (1923-)。 对于 Anderson 来说, Goldstone 定理显然不可能是普遍成立的, 因为当时人们就已经知道超导体是一个连续对称性 - U(1) 对称性 - 自发破缺的体系, 但在这一破缺过程中并没有产生无质量的 Goldstone 粒子。 Anderson 很正确地意识到 U(1) 对称性的定域特点是使 Goldstone 定理失效的关键。 由于并非只有定域 U(1) 对称性具有定域特点, 事实上所有杨-米尔斯理论也都具有这一特点。 因此 Anderson 在 1963 年猜测道: “Goldstone 的零质量困难并不是一个严重的困难, 因为我们很可能可以用一个相应的 Yang-Mills 零质量问题来消去它”。 Anderson 的想法得到了一些物理学家的认同, 但也有人认为这种凝聚态物理的类比不能应用到相对论量子场论中。 这一怀疑很快就被推翻了。 1964 年, 英国物理学家 P. Higgs (1929-)、 比利时物理学家 F. Englert 与 R. Brout 等几乎同时证实了 Anderson 的想法。 这便是描述规范对称性自发破缺的著名的 Higgs 机制[注四]。
不过 Higgs 等人的漂亮工作并没有引起立即的轰动。 Higgs 就这一工作所写的两篇短文的第二篇甚至一度遭到退稿, 理由是 “与物理世界没有明显关系”。 这一退稿理由使 Higgs 深感不快, 但也促使他更深入地考虑了理论可能带来的实验结果, 并对论文进行了补充。 Higgs 后来认为, 他因遭到退稿而偶然添加的那些内容是人们将 Higgs 粒子及 Higgs 机制与他的名字联系在一起的主要原因。
做了这么多的背景介绍, 现在让我们回到主题 - 质量的起源 - 上来。 Higgs 机制不仅一举 “救活” 了粒子物理学中对称性自发破缺与 Yang-Mills 理论这两个极为出色的想法, 而且在救助过程中为我们提供了一种产生质量的新方法, 即通过规范对称性的自发破缺, 从不带质量项的 Lagrangian 中产生出质量来。 我们在上面 (尤其是 [注四] 中) 已经提到规范粒子可以由此获得质量。 不过规范粒子的质量在宇宙可见物质质量中所占的比例极小, 我们更关心的是在可见物质质量中占主要比例的那些粒子 - 费米子。 那么费米子的情况如何呢? 1967 年, Weinberg 和 Salam 将 Higgs 机制应用到 S. Glashow (1932-) 等人几年前所提出的旨在描述电磁和弱相互作用的 SU(2)×U(1) 规范理论中, 建立起了所谓的电弱统一理论[注五]。 这一理论与描述强相互作用的量子色动力学一起组成了粒子物理的标准模型。 在标准模型中, 费米子也是通过规范对称性的自发破缺, 或者更确切地说, 通过电弱统一理论中的规范对称性自发破缺获得质量的。 具体地讲, 在标准模型中, 费米场 ψ 与标量场 - 也称为 Higgs 场 - φ 之间存在所谓的 Yukawa 耦合 -λψψφ (其中 λ 为耦合常数)[注六]。 由于 Higgs 场 φ 具有非零的真空期待值, 因此将这一耦合项相对于真空展开后就会出现费米子质量项 -mψψ。
因此, 在标准模型中, 所有基本粒子的质量都来源于电弱统一理论中的规范对称性自发破缺。 这是标准模型对质量起源问题的直接回答
因此, 在标准模型中, 所有基本粒子的质量都来源于电弱统一理论中的规范对称性自发破缺。 这是标准模型对质量起源问题的直接回答
No comments:
Post a Comment