海森堡不確定性原理的矩陣證明

本文的閱讀等級:高級
在量子力學裏,不確定性原理[1](uncertainty principle) 表明:粒子的位置與動量不可同時被確定,位置的不確定性 \Delta Q 與動量的不確定性 \Delta P 遵守不等式
\displaystyle  \Delta Q\cdot\Delta P\ge\frac{\hbar}{2}
其中 \hbar=h/(2\pi)h 是普朗克常數[2](Planck constant)。海森堡[3] (Werner Heisenberg) 在1927年發表的一篇論文裏,寫下
\Delta Q\cdot\Delta P\approx h
雖然他提到這公式可以從對易關係 (稍後將說明) 推導出來,但他並沒有寫出相關的數學論證,也沒有給予 \Delta Q\Delta P 確切的定義。同年,肯納德 (Earl Hesse Kennard) 首先證明了不確定關係不等式,1929年羅伯森 (Howard Percy Robertson) 又從對易關係推導出相同的結論[4]。本文使用現代讀者熟悉的矩陣分析方法證明不確定性原理。由於我對量子力學幾乎一無所知,在提到相關知識的時候均盡量列舉引用出處以方便讀者參照查詢。文中若有錯誤,歡迎不吝指正。


物理學家費曼 (Richard P. Feynman) 說[5]
量子力學所描述的,概括一切物質行為的細節,尤其對那些發生在原子尺度的部分特別管用。非常微小東西的行為,跟我們的直接經驗完全不同,它們的行為既非波動性質,亦非粒子性質。也不完全像雲、撞球檯上的球、或彈簧上的砝碼。總而言之,完全不像我們日常看見過的任何東西。
隨後又補充解釋:
因為所有人生經歷、思維直覺,無不是從大尺度事物來的。我們的經驗會隨時提醒我們,大尺度事物會如何因應,但是微小尺度的事物所採取的因應方式迥然不同。所以我們學習它的時候,必須強迫自己用抽象或想像的方式,而絕不能到我們直接經驗中去尋找聯想。

既然我們無法從直接經驗去尋找聯想量子世界的運行方式,物理學家選擇何種假設或模型,在很大的程度上取決於個人的想像力與信念。1925年海森堡思考著量子力學的建立基礎,他憶起愛因斯坦曾說[6]:「你的理論決定了你所觀察到的。」這句話啟發他換一個角度看待問題,之後他建議[4]:只有在實驗裏能夠測量到的物理量,稱為可觀察量 (observable),才可以用理論描述其物理行為。當然,並不是所有的物理學家都抱持相同的看法。量子力學的另一位創建者薛丁格 (Erwin Schrödinger) 起初也不認同海森堡的想法 (但很快地,薛丁格於1926年證明波力學與矩陣力學是量子力學的兩種等價描述[6])。儘管未獲得眾多同行的支持,海森堡、玻恩 (Max Born) 與約當 (Pascual Jordan) 仍於1925年共同創立矩陣力學[7](matrix mechanics),大膽假設關於運動的古典概念不適用於量子層級。在原子裏的電子並不是運動於明確的軌道,而是模糊不清,無法觀察到的軌域。海森堡棄絕任何涉及粒子運動軌道的詳細計算,因為這運動軌道是無法直接觀察到的。他選擇另一條道路:專注於研究電子躍遷時,所發射的光的離散頻率和強度。他計算出代表位置和動量的無限矩陣,這些矩陣能夠正確地預測電子躍遷所發射出光波的強度[4]

海森堡從電子轉移的現象歸納出矩陣力學的前提[7]:所有的可觀察物理量都可以用矩陣表示。矩陣的特徵值集合是該物理量可能出現的觀察值。對一般人來說,這絕對是一個聞所未聞的神秘主義。在經驗世界裏,我們頂多用一個隨機變數來表示可觀察量,譬如,投擲骰子可能出現的點數,可觀察量本身怎麼會跟矩陣扯上關係?況且在工程科學中,矩陣不都是拿來表示線性系統嗎?但量子力學不同於過去的典範,物理學家總是各憑本事編造出許多奇怪的想法企圖描繪原子層次的行為。不論信與不信,我們暫且接受這個瘋狂的假設。因為實驗測量的結果是實數,Hermitian 矩陣的特徵值又都是實數 (A 是 Hermitian 若 A^\ast=A,見“特殊矩陣 (九):Hermitian 矩陣”),所以我們可以用 Hermitian 矩陣來代表可觀察量。例如,Hermitian 矩陣
A=\left[\!\!\begin{array}{rcc}  3&0&i\\  0&1&0\\  -i&0&3  \end{array}\!\!\right]
有特徵值 1, 2, 4,說明 A 所代表的物理量僅能觀察到這三個值。如果實驗結果是某一特徵值,那麼對應的特徵向量表示在實驗測量之後的一瞬間物理系統所處的特徵狀態。(所謂特徵狀態代表甚麼意思呢?稍後說明。) Hermitian 矩陣的特徵向量是複向量,上例為 (0,1,0)^T, (1,0,i)^T, (1,0,-i)^T。這些特徵向量位於向量空間 \mathbb{C}^3,但並不是永遠如此,只是剛巧物理量以 3\times 3 階矩陣表示而已。舉例來說,設想一個粒子在直線上自由運動,我們用矩陣 X 來代表它的位置。由於粒子可能在直線上的任何點,觀察值可以是 X 的無窮多個特徵值所成的集合其中任一元素 x。這麼說來,X 必定是一個無限矩陣 (即無限大階數的矩陣),此矩陣的行空間 (特徵向量存在的空間) 也是一個無限維度的向量空間,它的正式名稱叫做 Hilbert 空間 (見 “從幾何向量空間到函數空間”)。在 Hilbert 空間中,向量具有無限維度,無限矩陣改稱為算子 (operator);我們仍然可以計算內積,因此向量長度與正交投影都有良好的定義。不過為方便解釋,以下我們只考慮有限維度的幾何座標空間 \mathbb{C}^n,讀者不妨想像 n 是一個極大的數或令 n\to\infty

為了弄清楚海森堡的想法,我們必須知道 Hermitian 矩陣的一些基本性質。在一量子系統中,令 n\times n 階 Hermitian 矩陣 A 代表一個可觀察量,其特徵值為 \lambda_i,對應特徵向量 \mathbf{x}_ii=1,\ldots,n。這些特徵向量構成一組完整的標準正交基底 (orthonormal basis) \{\mathbf{x}_1,\ldots,\mathbf{x}_n\},也就是說,\mathbf{x}_i^\ast\mathbf{x}_j=\delta_{ij}i,j=1,\ldots,n,其中 \delta_{ij} 是 Kronecker 記號,\delta_{ij}=1i=j\delta_{ij}=0i\neq j (見“實對稱矩陣可正交對角化的證明”)。令 n 維複向量 \mathbf{x} 代表量子系統處在的狀態,稱為量子態[8](quantum state)。若量子系統處在某個特徵狀態,\mathbf{x}=\mathbf{x}_i,物理量 A 的觀察值即是特徵值 \lambda_i。但當量子系統不在特徵狀態時,\mathbf{x}\neq\mathbf{x}_ii=1,\ldots,n,量子態 \mathbf{x} 又具有甚麼意義呢?將量子態 \mathbf{x} 表示成
\mathbf{x}=c_1\mathbf{x}_1+\cdots+c_n\mathbf{x}_n
上式左乘 \mathbf{x}_i^\ast 可得 c_i=\mathbf{x}_i^\ast\mathbf{x},此即 \mathbf{x}\mathbf{x}_i 的正交投影值,或者說,c_i\mathbf{x}\mathbf{x}_i 的成分或權重。量子態 \mathbf{x} 的物理意義可以從組合權重 \{c_i\} 來解釋。量子力學稱複數 c_i 為機率幅[9](probability amplitude),原因是 \vert c_i\vert^2=\overline{c_i}c_i 即為觀察值 \lambda_i 出現的機率。據此,量子態 \mathbf{x} 的組合係數絕對值平方 \vert c_1\vert^2,\ldots,\vert c_n\vert^2 表示在該狀態下,量子系統所有可能出現的觀察值 \lambda_1,\ldots,\lambda_n 的機率分配,故有歸一性 \sum_{i=1}^n\vert c_i\vert^2=1。因為 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\} 是一標準正交集,
\displaystyle\begin{aligned}  \Vert\mathbf{x}\Vert^2&=\mathbf{x}^\ast\mathbf{x}=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast\left(\sum_{j=1}^nc_j\mathbf{x}_j\right)\\  &=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\mathbf{x}_i^\ast\mathbf{x}_j=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\delta_{ij}=\sum_{i=1}^n\vert c_i\vert^2,\end{aligned}
可知量子態 \mathbf{x} 也滿足歸一性 \Vert\mathbf{x}\Vert^2=1。當系統處在量子態 \mathbf{x},如何計算可觀察量 A 的期望值呢?出乎意料外,答案是二次型 \mathbf{x}^\ast A\mathbf{x}。使用特徵方程 A\mathbf{x}_j=\lambda_j\mathbf{x}_j,可得
\displaystyle\begin{aligned}  \mathbf{x}^\ast A\mathbf{x}&=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast A\left(\sum_{j=1}^nc_j\mathbf{x}_j\right)=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast\left(\sum_{j=1}^nc_jA\mathbf{x}_j\right)\\  &=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast\left(\sum_{j=1}^nc_j\lambda_j\mathbf{x}_j\right)=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\lambda_j\mathbf{x}_i^\ast\mathbf{x}_j\\  &=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\lambda_j\delta_{ij}=\sum_{i=1}^n\lambda_i\vert c_i\vert^2.\end{aligned}
為簡化符號,可觀察量 A 在量子態 \mathbf{x} 的期望值表示為
\left\langle A\right\rangle=\mathbf{x}^\ast A\mathbf{x}
類似機率學的標準差 \sigma=\sqrt{E[(x-\mu)^2]}=\sqrt{E[x^2-\mu^2]},其中 \mu=E[x] 是隨機變數 x 的期望值,我們定義可觀察量 A 在量子態 \mathbf{x} 的不確定性 (uncertainty) 如下:
\Delta A=\sqrt{\mathbf{x}^\ast(A^2-\left\langle A\right\rangle^2I)\mathbf{x}}
關於矩陣力學基礎知識的討論至此告一段落,不確定性原理的證明即將展開。

1925年,玻恩閱讀了海森堡的論文後,發現位置與動量無限矩陣有一個很顯著的關係──它們不可交換 (或說不互相對易)[4,7]。不確定性原理是下列不互相對易關係的直接結果:
[Q,P]=i\hbar I
其中 Q 是位置矩陣,P 是動量矩陣,I 是單位矩陣,i=\sqrt{-1}。上式中,[Q,P] 稱為交換子 (commutator,或稱對易算符),定義為
[Q,P]=QP-PQ
注意,上述不互相對易關係僅適用於無限矩陣 (即量子力學的算符)。若 PQn\times n 階有限矩陣,使用跡數循環不變性,
\hbox{tr}(QP-PQ)=\hbox{tr}(QP)-\hbox{tr}(PQ)=\hbox{tr}(QP)-\hbox{tr}(QP)=0
\hbox{tr}(i\hbar I)=ni\hbar。在無限維空間,跡數未必定義完善,因為它不一定收斂。下面介紹的證法大致依循諾伊曼 (John von Neumann) 的推演方式[10]。第一個步驟設法創造一個引入交換子 [Q,P] 的數學式。諾伊曼選擇了 (Q\mathbf{x})^\ast(P\mathbf{x})。因為 QP 是 Hermitian 矩陣,Q^\ast=QP^\ast=P,可得
\begin{aligned}  (Q\mathbf{x})^{\ast}(P\mathbf{x})-(P\mathbf{x})^{\ast}(Q\mathbf{x})&=\mathbf{x}^{\ast}Q^{\ast}P\mathbf{x}-\mathbf{x}^{\ast}P^{\ast}Q\mathbf{x}\\  &=\mathbf{x}^\ast QP\mathbf{x}-\mathbf{x}^\ast PQ\mathbf{x}\\  &=\mathbf{x}^\ast(QP-PQ)\mathbf{x}\\  &=\mathbf{x}^\ast [Q,P]\mathbf{x}=\mathbf{x}^\ast i\hbar I\mathbf{x}\\  &=i\hbar\Vert\mathbf{x}\Vert^2=i\hbar,  \end{aligned}
其中最後一個等式係因量子態滿足歸一性 \Vert\mathbf{x}\Vert^2=1。根據內積性質 (P\mathbf{x})^\ast(Q\mathbf{x})=\overline{(Q\mathbf{x})^\ast(P\mathbf{x})} (見“內積的定義”),我們可以得到另一個表達式:
(Q\mathbf{x})^\ast(P\mathbf{x})-(P\mathbf{x})^\ast (Q\mathbf{x})=2i\mathrm{Im}\{(Q\mathbf{x})^\ast (P\mathbf{x})\}
其中 \mathrm{Im}\{z\} 代表複數 z 的虛部。比較上面兩式,即有
\displaystyle  \mathrm{Im}\{(Q\mathbf{x})^{\ast}(P\mathbf{x})\}=\frac{\hbar}{2}
為了產生不確定性關係,下一個步驟必須引進不等式。複數的絕對值大於或等於它的虛部,即 \vert z\vert\ge \mathrm{Im}\{z\},所以
\displaystyle  \left|(Q\mathbf{x})^{\ast}(P\mathbf{x})\right|\ge\frac{\hbar}{2}
接著分離不等式裡面的 QP。使用 Schwarz 不等式 (見“Schwarz 不等式”)
\Vert Q\mathbf{x}\Vert\cdot\Vert P\mathbf{x}\Vert\ge\left|(Q\mathbf{x})^{\ast}(P\mathbf{x})\right|
可得
\displaystyle  \Vert Q\mathbf{x}\Vert\cdot\Vert P\mathbf{x}\Vert\ge\frac{\hbar}{2}
現在我們已經抵達整個推導過程的中途休息站,眼前的不等式是對易關係 [Q,I]=i\hbar I 的必然結果。海森堡不確定關係不等式與這個不等式有完全相同的形式,暗示我們剩下的工作不過就是將不確定性套入其中。

定義一組新的位置矩陣和動量矩陣:
Q'=Q-\left\langle Q\right\rangle I,~~~P'=P-\left\langle P\right\rangle I
其中 \left\langle Q\right\rangle\left\langle P\right\rangle 分別代表在量子態 \mathbf{x},位置 Q 和動量 P 的期望值。明顯地,Q'P' 也是 Hermitian 矩陣。利用交換子運算法則 (見“交換子與可交換矩陣”):
(1) [A,I]=[I,A]=0
(2) \left[A+B,C+D\right]=[A,C]+[B,C]+[A,D]+[B,D]
(3) [kA,B]=[A,kB]=k[A,B]k 是一純量,
可導出
\begin{aligned}  \left[Q',P'\right]&=[Q-\left\langle Q\right\rangle I,P-\left\langle P\right\rangle I]\\  &=[Q,P]-\left\langle Q\right\rangle[I,P]-\left\langle P\right\rangle[Q,I]+\left\langle Q\right\rangle\left\langle P\right\rangle[I,I]\\  &=[Q,P]=i\hbar.\end{aligned}
我們發現 Q'P' 也遵守對易關係,以 Q' 取代 QP' 取代 P,即得
\displaystyle  \Vert Q'\mathbf{x}\Vert\cdot\Vert P'\mathbf{x}\Vert\ge\frac{\hbar}{2}
這個不等式其實就是不確定性原理。何以如此?利用 Q'\left\langle Q\right\rangle(\Delta Q)^2 的定義,
\begin{aligned}  \Vert Q'\mathbf{x}\Vert^2&=(Q'\mathbf{x})^\ast(Q'\mathbf{x})=\mathbf{x}^\ast (Q')^\ast Q'\mathbf{x}=\mathbf{x}^\ast (Q')^2\mathbf{x}\\  &=\mathbf{x}^\ast(Q-\left\langle Q\right\rangle I)^2\mathbf{x}=\mathbf{x}^\ast(Q^2-2\left\langle Q\right\rangle Q+\left\langle Q\right\rangle^2 I)\mathbf{x}\\  &=\mathbf{x}^\ast(Q^2-\left\langle Q\right\rangle^2 I)\mathbf{x}=(\Delta Q)^2.\end{aligned}
同樣地,\Vert P'\mathbf{x}\Vert^2=(\Delta P)^2。所以,
\displaystyle  \Delta Q\cdot\Delta P\ge\frac{\hbar}{2}

從以上推導我們知道不確定性原理並非源自實驗儀器的測量誤差,而是粒子內稟的量子性質,即位置與動量不互相對易關係。最後我引用維基百科關於不確定性原理「名稱」的一段論述當作本文的結語[1]
有很久一段時間,不確定性原理被稱為「測不準原理」,但事實上,不確定性原理是類波系統內秉的性質,與測量準確不準確並沒有關係 (請查閱本條目稍後觀察者效應一節),因此,該譯名並未正確表達出這原理的內涵。另外,英語稱此原理為「Uncertainty Principle」,直譯為「不確定性原理」,並沒有「測不準原理」這種說法,其他語言與英語的情況類似,除中文外,並無「測不準原理」一詞。現今,在中國大陸的教科書中,該原理的正式譯名也已改為「不确定性原理」。

註解
[1] 維基百科:不確定性原理,見「名稱」一節。
[2] 普朗克常數 h 是量子力學的註冊商標,出現在普朗克關係式 E=h\nu,其中 E 是粒子的能量,\nu 是電磁波的頻率。普朗克常數與光速 c 和萬有引力常數 G 並稱為大自然的三個基本常數。詳見維基百科:普朗克常數
[3] 關於海森堡 (Werner Heisenberg) 的生平介紹請見維基百科:維爾納‧海森堡
[4] 維基百科:不確定性原理,見「歷史」一節。
[5] 費曼 (Richard P. Feynman) 著 Essentials of Physics Explained by Its Most Brilliant Teacher,中譯本《費曼的六堂Easy物理課》,師明睿譯,天下文化出版,2001年,頁153-155。
[6] 愛因斯坦對海森堡說的英譯文是:“It is the theory which decides what can be observed.” 見談測不準原理的起始,原標題是 Remarks on the Origin of the Relations of Uncertainty。
[7] 矩陣力學 (matrix mechanics) 是量子力學的一種表述形式,由海森堡、玻恩 (Max Born) 和約當 (Pascual Jordan) 於1925年提出。矩陣力學假設 (1) 所有的可觀察物理量都可以用 Hermitian 矩陣表示,(2) 一個物理量的觀察值是該矩陣的特徵值,(3) 一個物理系統的位置矩陣 Q 與動量矩陣 P 滿足對易關係:QP-PQ=i\hbar I。對易關係無法從古典物理推導出來,它是一個全新的假定,只有實驗才能確認它的真實性。見維基百科:矩陣力學
[8] 量子態 (quantum state) 描述量子系統的狀態。在量子系統裏,量子態由所有可觀察量的機率分布所定義。見維基百科:量子態
[9] 機率幅 (probability amplitude) 是一個描述粒子的量子行為的複函數。當描述粒子的位置時,機率幅是一個波函數,表達為位置的函數。在量子力學中,機率幅常用 \Psi 表示,\vert \Psi\vert^2=\Psi^\ast\Psi 則代表機率幅的機率密度函數。見維基百科:機率幅
[10] 諾伊曼 (John von Neumann) 所著 Mathematical Foundations of Quantum Mechanics,1949年出版,頁233-235。