超導理論簡介:BCS theory
為何會出現超導態的物體總是一些在室溫時電阻很大的物體呢?為何室溫環境下那些低電阻的金屬(或者說導電性極佳的金屬),反而怎麼降溫都沒有出現超導態?按照我們的理論,電阻的產生一部份是來自電子受到聲子的散射,或者說電子與聲子發生交互作用,而導電性極佳的金屬就是因為電阻小,換句話說就是電子與聲子的交互作用是微弱的,這種現象可以提供BCS theory 的產生線索—物體的超導態可能肇因於電子與聲子的交互作用!因此,電子與聲子之間交互作用弱的物質反而不易產生超導態
當外加磁場繼續增加,超導體內部的一般態細線的數目便一直增加,直到外加磁場達到,整塊超導體便完全轉變成一般態。
(六)超導理論簡介:BCS
theory
為何會出現超導態的物體總是一些在室溫時電阻很大的物體呢?為何室溫環境下那些低電阻的金屬(或者說導電性極佳的金屬),反而怎麼降溫都沒有出現超導態?按照我們的理論,電阻的產生一部份是來自電子受到聲子的散射,或者說電子與聲子發生交互作用,而導電性極佳的金屬就是因為電阻小,換句話說就是電子與聲子的交互作用是微弱的,這種現象可以提供BCS
theory 的產生線索—物體的超導態可能肇因於電子與聲子的交互作用!因此,電子與聲子之間交互作用弱的物質反而不易產生超導態!
(1)Cooper Pairs
根據BCS theory,超導態的形成有一基本條件那就是電子間必須存在一吸引力,那吸引力必須強到足以克服電子與電子之間的庫倫排斥力,當物體內兩電子之間存在一足以克服兩電子的庫倫排斥力時,兩電子便會形成根據BCS
theory,電子與電子之間的這種吸引力來自於電子與聲子的交互作用,如果用古典的模型來解釋可以下圖說明,
當一個電子通過晶格時,由於電子與晶格的交互作用,使得電子附近的帶正電離子會靠近電子,導致晶格瞬間局域極化,所以這一局部鄰域便會顯現出正電性,這時如果有往相反方向的電子通過便會受到局域極化的晶格之正電性所吸引,因此,兩電子便透過此一吸引力形成所謂的Cooper
Pair,根據此一理論,我們可以大概推估當兩電子形成Cooper
Pair時,兩電子的平均距離不可能太近,理由很簡單,兩電子太近的話,兩電子透過與晶格的交互作用所產生的等效吸引力將不足克服兩電子的庫倫排斥力!
若用量子力學的語言來說明,就是第一個電子改變了各頻率的晶格震盪中的聲子數目,而這些聲子再影響第二個電子的波函數。
當兩電子的波向量大小相等方向相反,且自旋反向時,這種吸引力最強。我們可以把一個Cooper Pair 視為單一粒子,其帶電量為,而其自旋為零,因此,這種粒子屬於玻色子,必須遵守Bose-Einstein
統計,這也是導致超導現象的主因,因為根據Bose-Einstein 統計,同一態被多少個粒子所佔據並無任何限制,所以這種Cooper
Pairs所組成的電子系統,其基態就是所有的Cooper Pairs都處於同一個最低的能態,在這種狀態下,晶格動量為零(零電流)。但是請注意並不是電子有成對(波向量大小相等,自旋反向)就可以產生超導性,重點是兩電子存在交互作用的吸引力(透過聲子),下面我們將論證這個事實。
無論這種吸引力交互作用有多弱,只要吸引力交互作用存在,則電子對的能量必定會下降,考慮一個在絕對零度的自由電子系統()因此,電子的波函數形如,而且在費米球內的態全部都被占滿,如果兩電子之間沒有吸引力交互作用,則波向量大小相等,方向相反的兩個電子,他們的波函數為,where 。當然這樣寫是不完整的,因為它只有兩電子相對距離為時的物理資訊,而沒有兩電子系統的質心運動資訊,因此,得到完整的波函數還要乘上一個兩電子的質心運動之波函數,但是因為兩電子的總動量為零,所以關於質心運動部分只是一個常數,後面我們討論到超導電流時,這一部分才會出現。
為了簡化計算,我們假設電子對都處於費米面上,所以在沒有吸引力存在時
簡介超導體 物理教師:
曹筠裕
一、前言
一般純單晶金屬只有當溫度趨近絕對零度時,其電阻才會趨近零,但有些物質在溫度尚高於零度時,其電阻已經達到零,我們稱這些物質為超導體。
超導體有近乎完美的反磁性:當我們將超導體置於一外磁場中時,在超導體的內部磁場為零,這並不是說超導體會將外加磁場趕到外部,而是超導體置於外磁場時,會在內部形成一磁場抵銷外磁場,但是當外加磁場太大,大到某一臨界值時,處於超導態的物體會變成一般態(失去超導特性),因此,我們可以按照外加磁場對超導態的影響將超導體分成兩大類,所謂的第一型的超導體是指當外加磁場大到可以滲透到原超導態的物體內部時,物體的超導態便完全被破壞,而變成一般態,我們稱此外加磁場為臨界磁場,也就是說第一型的超導體只有在低於臨界磁場的環境下才能進入超導態,而第二型的超導體則有兩個臨界磁場,第二型超導體在低於第一臨界磁場的外加磁場環境下與第一型超導體一樣具有完美的反磁性,也就是其內部磁場為零,可是當外加磁場超過第一臨界磁場時,物體仍具有超導性,且內部磁場並不完全為零,直到外加磁場達到第二臨界磁場時,物體的超導態才完全被破壞或者說完全轉變為一般態。
對於超導性,目前的理論解釋認為是由於電子與聲子的交互作用所造成,這也解釋了為何反而導電性越好的金屬反而(目前)無法進入超導態,因為一般室溫導電性好的金屬表示其電子幾乎很少被聲子所散射(電阻小),不過,目前的實驗研究發現越來越多挑戰此種理論的地方,後面我們會對此一情形做一簡單說明。
二、超導現象
(一)永久電流:
要驗證物體是否真的零電阻的方法之一是量測在無外加電場作用下的超導體回路電流,假如超導體的電阻真的等於零則其電流將不會隨著時間衰減為零。我們要使超導體感應出電流的方法是先把一個超導材料做成的線圈在一般態時使外加磁場穿過迴路,再把它降溫至超導態,同時將磁場降為零,過一段時間後,電流可以透過測量磁場決定,我們發現經過超過一年後,超導迴路內的電流仍然維持相同的大小強度,並沒有任何衰減的跡象。這個現象使我們相信超導體的電阻確實等於零。
(二)熱力學特性
比熱可以提供產生超導過程的一些線索,如果我們把物體的比熱分成來自電子的比熱貢獻部分與來自聲子的比熱貢獻部分,研究來自電子的比熱貢獻部分隨溫度的變化時,實驗發現來自電子的比熱貢獻在超導臨界溫度(超導態<->一般態)時會發生不連續的變化,但是來自聲子的比熱貢獻在超導臨界溫度時則仍然是連續的,這表示超導態的產生是與電子系統的狀態是有關聯的,而非聲子系統!雖然超導態與電子的狀態有關,但是聲子仍然在超導現象中扮演著很重要的角色,因為我們發現超導臨界溫度會受到固體中原子的質量大小影響,實驗上,我們可以把超導體中的化學成分用相同化學成分,但不同質量的同位素取代,結果實驗發現超導臨界溫度會正比原子質量的負α次方,α的值大約是0.5(不同的超導体會有些微的差異),這種現象我們稱之為超導體的同位素效應,就超導研究歷史而言,我們可以說超導體的同位素效應指出了一可行的超導理論之方向。
事實上,比熱可以視為一種測量系統的entropy(亂度)隨溫度之變化率的方法
比熱可以提供產生超導過程的一些線索,如果我們把物體的比熱分成來自電子的比熱貢獻部分與來自聲子的比熱貢獻部分,研究來自電子的比熱貢獻部分隨溫度的變化時,實驗發現來自電子的比熱貢獻在超導臨界溫度(超導態<->一般態)時會發生不連續的變化,但是來自聲子的比熱貢獻在超導臨界溫度時則仍然是連續的,這表示超導態的產生是與電子系統的狀態是有關聯的,而非聲子系統!雖然超導態與電子的狀態有關,但是聲子仍然在超導現象中扮演著很重要的角色,因為我們發現超導臨界溫度會受到固體中原子的質量大小影響,實驗上,我們可以把超導體中的化學成分用相同化學成分,但不同質量的同位素取代,結果實驗發現超導臨界溫度會正比原子質量的負α次方,α的值大約是0.5(不同的超導体會有些微的差異),這種現象我們稱之為超導體的同位素效應,就超導研究歷史而言,我們可以說超導體的同位素效應指出了一可行的超導理論之方向。
事實上,比熱可以視為一種測量系統的entropy(亂度)隨溫度之變化率的方法
從實驗發現低於超導臨界溫度時,超導態的entropy下降的速率遠比一般態(我們使用將超導体質外加高於臨界磁場的方法使同一物體在低於無磁場的超導臨界溫度時處於一般態)的下降速率來得快,這一實驗結果暗示物體處於超導態時的電子系統比處於一般態時的電子系統來得更整齊有序。
在低溫時,超導體的比熱資料可以滿足型式,且和與溫度無關(低溫時),因此,比熱只是的函數,這種現象暗示著電子的能譜存在一個的能隙。
實驗顯示正比超導臨界溫度,在低溫時大約可以用近似。因此,雖然我們無法直接量測能隙,但我們可以肯定的是高溫超導體應該必須具有很大的能隙。
有一種方法或許可以量測超導體的能隙存在,那就是量測超導體對電磁波吸收(也就是光子的吸收),由於微波光子的能量比超導能隙還低,因此,雖然室溫時,一般態的金屬可以高度反射微波,但是如果我們把它降溫至低於超導臨界溫度,對微波而言,超導態的金屬會變成透明的,也就是說進入超導態的金屬不再吸收微波光子,可是一般態時卻會吸收微波光子,這表示這種能隙在一般態時並不存在。
(三)The
Meissner Effect
當我們將超導體置入磁場中時,超導體會受到磁場排斥,並且將磁力線排擠到超導體外部,這種現象並不是說外加磁場無法進入超導體內,而是當我們把超導體置入外加磁場中時,超導體內部馬上會產生一磁場與外加磁場護消抵銷,下圖顯示在同一物體在一般態時置入磁場中與進入超導態時置入磁場中磁力線在物體附近的分布圖。
當我們將超導體置入磁場中時,超導體會受到磁場排斥,並且將磁力線排擠到超導體外部,這種現象並不是說外加磁場無法進入超導體內,而是當我們把超導體置入外加磁場中時,超導體內部馬上會產生一磁場與外加磁場護消抵銷,下圖顯示在同一物體在一般態時置入磁場中與進入超導態時置入磁場中磁力線在物體附近的分布圖。
從這個圖形,我們可以發現磁力線繞過超導體表面附近的磁力線密度會遠比一般態時相同地方的磁力線密度。
然而,磁力線並非完全無法進入超導體(即使是型一的超導體),實驗發現磁場是隨著距超導體表面的深度作指數型衰減,磁場穿入的特徵深度大約是幾百埃左右。
在外磁場中的超導體內部為什麼磁場會等於零呢?這是由於放入外磁場中的超導體在其表面會感應出表面電流,表面電流產生的磁場抵銷了外磁場所致,但我們怎麼知道內部無電流,而是只有表面產生電流呢?因為根據穩態的馬克士威方程式 ,若超導體內部磁場為零,則內部電流密度也必須為零。
如果按照磁性來分類的話,超導體可以說是完美的反磁性物質,也就是說它的磁化率(susceptibility)是,下面我們可以簡單的利用馬克士威方程式導出超導體的磁化率,根據定義,磁偶矩密度,其中,注意這裡的是外加磁場的部分,又
將磁偶矩密度與外磁場關係式代入,並且因超導體內部磁場為零,因此,
超導體具有反磁性應該是很合理的現象,因為當我們把超導體置入加磁場中時,超導體感受到的磁場由無變有(磁場變化會產生感應電場),因此,根據法拉第電磁感應,超導體將被感應出感應電動勢與感應電流,但由於物體處於超導態,所以當場達到穩定值時,雖然感應電動勢會消失,但是感應電流並不會衰減為零,因此,超導體會出現反磁性現象。
(四)臨界磁場
當我們把超導體置入外磁場中時,如果當外磁場大到某一臨界值時,超導體的超導態會被破壞,物體將由原來的超導態轉變成一般態,我們稱此一磁場臨界值為臨界磁場,首先我將先討論第一型的超導體(type
1),我們可以用磁偶矩密度作為外加磁場的函數,並且將兩者關係作成一關係圖,如下圖所示,當外加磁場大到某一臨界值時,磁場會突然穿入超導體內,同時物體便從超導態轉變成一般態。
對於第一型的超導體,其臨界磁場是溫度的函數,除了在超導臨界溫度附近,臨界磁場幾乎是溫度的二次函數,如下圖所示。
現在我們要利用臨界磁場來估算發生超導轉變時物體的一單位體積的能量變化,考慮某一超導體在溫度為絕對零度時,利用逐漸提高外加磁場(從零開始),我們需要多少磁能才能將超導態轉變成一般態,因為改變物體一單位體積的磁偶極矩發生的變化,所需的能量是,但是對於第一型超導體而言,在超導體內,所以,對積分,從0積到,可得。
另外臨界磁場的存在使得超導體所能負載的電流有了限制,當超導體負載的電流所產生的感應磁場大到臨界磁場時,超導態便會被破壞,使物體轉變成一般態,例如,以一條圓形截面的長質導線而言,假設其負載電流I,導線截面半徑R,則根據馬克士威方程式積分可得,則導線內部距離中心軸處的磁場大小為,當這個值超過了臨界磁場,則其外圍區域將轉變成一般態, 如圖所示,外圍區域是的部分。
(五)第二型超導體
如果一個超導體存在兩個臨界磁場,,當外加磁場小於較小的臨界磁場,時,第二型超導體就像第一型超導體一般具有完美的反磁性,超導體內部磁場等於零,但是當外加磁場介於兩個臨界磁場之間時,超導體內部並非磁場等於零,而是處於所謂的vortex
state,這時內部處於一般態的部分就像一根根的細線般穿過超導態的部分,這些穿過超導體處於一般態之細線所在區域稱為vortex區,其磁偶矩密度與外加磁場的關係如下圖所示,
當外加磁場繼續增加,超導體內部的一般態細線的數目便一直增加,直到外加磁場達到,整塊超導體便完全轉變成一般態。
(六)超導理論簡介:BCS
theory
為何會出現超導態的物體總是一些在室溫時電阻很大的物體呢?為何室溫環境下那些低電阻的金屬(或者說導電性極佳的金屬),反而怎麼降溫都沒有出現超導態?按照我們的理論,電阻的產生一部份是來自電子受到聲子的散射,或者說電子與聲子發生交互作用,而導電性極佳的金屬就是因為電阻小,換句話說就是電子與聲子的交互作用是微弱的,這種現象可以提供BCS
theory 的產生線索—物體的超導態可能肇因於電子與聲子的交互作用!因此,電子與聲子之間交互作用弱的物質反而不易產生超導態!
(1)Cooper Pairs
根據BCS theory,超導態的形成有一基本條件那就是電子間必須存在一吸引力,那吸引力必須強到足以克服電子與電子之間的庫倫排斥力,當物體內兩電子之間存在一足以克服兩電子的庫倫排斥力時,兩電子便會形成根據BCS
theory,電子與電子之間的這種吸引力來自於電子與聲子的交互作用,如果用古典的模型來解釋可以下圖說明,
當一個電子通過晶格時,由於電子與晶格的交互作用,使得電子附近的帶正電離子會靠近電子,導致晶格瞬間局域極化,所以這一局部鄰域便會顯現出正電性,這時如果有往相反方向的電子通過便會受到局域極化的晶格之正電性所吸引,因此,兩電子便透過此一吸引力形成所謂的Cooper
Pair,根據此一理論,我們可以大概推估當兩電子形成Cooper
Pair時,兩電子的平均距離不可能太近,理由很簡單,兩電子太近的話,兩電子透過與晶格的交互作用所產生的等效吸引力將不足克服兩電子的庫倫排斥力!
若用量子力學的語言來說明,就是第一個電子改變了各頻率的晶格震盪中的聲子數目,而這些聲子再影響第二個電子的波函數。
當兩電子的波向量大小相等方向相反,且自旋反向時,這種吸引力最強。我們可以把一個Cooper Pair 視為單一粒子,其帶電量為,而其自旋為零,因此,這種粒子屬於玻色子,必須遵守Bose-Einstein
統計,這也是導致超導現象的主因,因為根據Bose-Einstein 統計,同一態被多少個粒子所佔據並無任何限制,所以這種Cooper
Pairs所組成的電子系統,其基態就是所有的Cooper Pairs都處於同一個最低的能態,在這種狀態下,晶格動量為零(零電流)。但是請注意並不是電子有成對(波向量大小相等,自旋反向)就可以產生超導性,重點是兩電子存在交互作用的吸引力(透過聲子),下面我們將論證這個事實。
無論這種吸引力交互作用有多弱,只要吸引力交互作用存在,則電子對的能量必定會下降,考慮一個在絕對零度的自由電子系統()因此,電子的波函數形如,而且在費米球內的態全部都被占滿,如果兩電子之間沒有吸引力交互作用,則波向量大小相等,方向相反的兩個電子,他們的波函數為,where 。當然這樣寫是不完整的,因為它只有兩電子相對距離為時的物理資訊,而沒有兩電子系統的質心運動資訊,因此,得到完整的波函數還要乘上一個兩電子的質心運動之波函數,但是因為兩電子的總動量為零,所以關於質心運動部分只是一個常數,後面我們討論到超導電流時,這一部分才會出現。
為了簡化計算,我們假設電子對都處於費米面上,所以在沒有吸引力存在時,它們的波向量都是,電子能量都是,但由於吸引力的存在,所以聲子會把兩電子所形成的電子對從某一電子對狀態散射成另一種電子對狀態,因此,電子對波函數必須是各種平面波的線性疊加。也就是
(1)
現在我們可以假設兩電子間的吸引力所造成的位能貢獻為,很合理的,我們可以假設它是兩電子之間的距離之函數。因此,我們可以寫下電子對的 equation:
(2)
其中是只作用在第一個電子的座標,而是因為吸引力存在所造成的能量變化量。
將(1)代入(2),我們可以得到
(3)
為了方便起見,我們可以令,代入上式,我們可以得到
(4)
把式(4)乘以,並對整個樣品作積分,假設樣品的體積是,
則 (5)
其中。
現在我們可以利用幾個條件來簡化計算,首先由於在費米球內部的態全部都填滿,因此,吸引力不可能把電子散射到費米球內部(也就是的態),所以對於,再者,因為吸引力是肇因於電子與聲子的交互作用,所以這種吸引力不可能把電子散射到能量大於的狀態,這裡的是聲子頻譜中角頻率最大值,現在我們以德拜角頻率來近似。在式子(5)中的求和, 或者都只能在從費米面開始厚度為的球殼之內。
只要 或者都在這個薄球殼之內,則我們可以把視為常數,其中因為是吸引力位能,所以必須是正數。
所以式子(5)變成
(6)
兩邊同時對求和,因為 ,所以式子(6)變成
(7)
使用態密度來把求和改成積分,由於一個Cooper
Pair中的兩電子自旋是相反方向,所以使用態密度必須注意只能考慮某一種自旋,不可以把自旋向上和向下全都計入考慮,否則就多算了狀態的數目,假設就是一般情形下電子態密度的一半,所以式子(7)可以改用積分計算
(8)
由於在的範圍內,幾乎沒有多大的變化,因此,我們可以近似的把它當作常數提到積分外面,
因此,我們已經證得當兩電子形成庫柏對時,它們的能量會比兩個自由電子對的能量來得下降,所以我們可以說庫柏對中的兩個電子處於"準"束縛態,為什麼說是準束縛態,而非真的束縛態呢?因為庫柏對中兩電子的能量相對於導電帶底部仍然是正的!
(2)超導基態
前面我們談的只是單一個庫柏對的能量問題,現在我們要進一步討論整個超導體的能量問題,由於所需數學較複雜,因此這裡我們僅作定性討論。
因為庫柏對中的電子波函數中包含在費米能階上自由電子態,所以這些電子並不會一直占據在費米能階上,有時這些在費米能階上的自由電子態是空的,因此,低於費米能階的自由電子便有被散射到這些空態上形成庫柏對,超導性是集體合作現象,當費米面附近的電子形成庫柏對時,會促使費米面內的電子也形成庫柏對,但是這樣的過程並不會持續無限的進行下去,因為如果低於費米能階的自由電子態空下來,則庫柏對中的電子可能會被散射到這些狀態上,因此降低了形成準束縛態的趨勢。
當超導體處於絕對零度時,在其費米面附近,部分占滿的狀態之能量範圍令為,注意這與一般態不同,一般態在絕對零度時,在費米面內全部填滿,但是費米面外完全是空的!
,在很小的極限下。
一般人會把解釋成破壞一個庫柏對平均一個電子所需要的能量,但這樣解釋很容易造成誤解,因為它是來自所有電子集體運動的一個物理參數,而非來自單一庫柏電子對。
當然這個式子並非對所有超導體都適用,例如像一些強耦合的超導體,其吸引力位能函數便非常複雜,因此,其形式也會有所不同。
另外我們還可以利用BCS theory導出在絕對零度時,物體的電子系統在超導態與一般態的能量差異如下:
(3)超導能隙
假如在一般態時,在費米面外的一個電子狀態能量是,則根據BCS
theory在超導態時對應的能階會變成
(9)
,而低於費米能階的狀態能量會變成
(10)
也就是說電子與聲子的交互作用會改變激發態的能階。
因此在絕對零度時高於費米能階的最低能階為(代入(9)),而低於費米能階的最大能階為(代入(10))。
所以要把一個電子從費米能階下激發到費米能階之上至少需要 ,在這個能隙上的電子都是未成對,因此我們稱之為一般電子,在能隙下的電子則稱為超導電子,當溫度介於絕對零度與超導臨界溫度之間時,系統中的電子是一般電子與超導電子的混合態,當到達絕對零度時,所有的電子變全部變成超導電子。
由於超導性的產生是因為電子與聲子的交互作用,因此我們可能會錯誤的以為超導能隙大約是的數量級以及超導臨界溫度大約是德拜溫度的數量級,這樣的話,很多物質在遠高於室溫就會具有超導性,根據BCS
theory
這個式子說明超導能隙越大,超導臨界溫度也越大,也就是說電子與聲子的交互作用越強的話,超導臨界溫度越大!這也說明了為何在一般態時電阻很大的物質反而可以形成比較高溫的超導體,因為電子與聲子的交互作用越強,一般態時的電阻越大。
(4)Cooper Pairs(庫柏對)的實驗證明-約瑟夫森振盪
物理學家約瑟夫森利用兩塊超導體A、B中間夾一層非常薄的絕緣體C,這樣的組成稱為約瑟夫森結,並把電源接到A和B,假設電源電壓V,則就會有頻率的電磁波從約瑟夫森結發射出來,由頻率式子中的可以看出這種現象顯然是因為庫柏電子對存在所造成的效應。
因為超導態時,所有的庫柏電子對不是零動量(沒有電流),不然就是具有相同的動量,當庫柏電子對通過絕緣體時,受到電壓的作用,因此兩塊超導體的庫柏電子對的能量相差了,相位發生變化,因此會發射出頻率的電磁波。
簡介超導體 物理教師:
曹筠裕
一、前言
一般純單晶金屬只有當溫度趨近絕對零度時,其電阻才會趨近零,但有些物質在溫度尚高於零度時,其電阻已經達到零,我們稱這些物質為超導體。
超導體有近乎完美的反磁性:當我們將超導體置於一外磁場中時,在超導體的內部磁場為零,這並不是說超導體會將外加磁場趕到外部,而是超導體置於外磁場時,會在內部形成一磁場抵銷外磁場,但是當外加磁場太大,大到某一臨界值時,處於超導態的物體會變成一般態(失去超導特性),因此,我們可以按照外加磁場對超導態的影響將超導體分成兩大類,所謂的第一型的超導體是指當外加磁場大到可以滲透到原超導態的物體內部時,物體的超導態便完全被破壞,而變成一般態,我們稱此外加磁場為臨界磁場,也就是說第一型的超導體只有在低於臨界磁場的環境下才能進入超導態,而第二型的超導體則有兩個臨界磁場,第二型超導體在低於第一臨界磁場的外加磁場環境下與第一型超導體一樣具有完美的反磁性,也就是其內部磁場為零,可是當外加磁場超過第一臨界磁場時,物體仍具有超導性,且內部磁場並不完全為零,直到外加磁場達到第二臨界磁場時,物體的超導態才完全被破壞或者說完全轉變為一般態。
對於超導性,目前的理論解釋認為是由於電子與聲子的交互作用所造成,這也解釋了為何反而導電性越好的金屬反而(目前)無法進入超導態,因為一般室溫導電性好的金屬表示其電子幾乎很少被聲子所散射(電阻小),不過,目前的實驗研究發現越來越多挑戰此種理論的地方,後面我們會對此一情形做一簡單說明。
二、超導現象
(一)永久電流:
要驗證物體是否真的零電阻的方法之一是量測在無外加電場作用下的超導體回路電流,假如超導體的電阻真的等於零則其電流將不會隨著時間衰減為零。我們要使超導體感應出電流的方法是先把一個超導材料做成的線圈在一般態時使外加磁場穿過迴路,再把它降溫至超導態,同時將磁場降為零,過一段時間後,電流可以透過測量磁場決定,我們發現經過超過一年後,超導迴路內的電流仍然維持相同的大小強度,並沒有任何衰減的跡象。這個現象使我們相信超導體的電阻確實等於零。
(二)熱力學特性
比熱可以提供產生超導過程的一些線索,如果我們把物體的比熱分成來自電子的比熱貢獻部分與來自聲子的比熱貢獻部分,研究來自電子的比熱貢獻部分隨溫度的變化時,實驗發現來自電子的比熱貢獻在超導臨界溫度(超導態<->一般態)時會發生不連續的變化,但是來自聲子的比熱貢獻在超導臨界溫度時則仍然是連續的,這表示超導態的產生是與電子系統的狀態是有關聯的,而非聲子系統!雖然超導態與電子的狀態有關,但是聲子仍然在超導現象中扮演著很重要的角色,因為我們發現超導臨界溫度會受到固體中原子的質量大小影響,實驗上,我們可以把超導體中的化學成分用相同化學成分,但不同質量的同位素取代,結果實驗發現超導臨界溫度會正比原子質量的負α次方,α的值大約是0.5(不同的超導体會有些微的差異),這種現象我們稱之為超導體的同位素效應,就超導研究歷史而言,我們可以說超導體的同位素效應指出了一可行的超導理論之方向。
事實上,比熱可以視為一種測量系統的entropy(亂度)隨溫度之變化率的方法
比熱可以提供產生超導過程的一些線索,如果我們把物體的比熱分成來自電子的比熱貢獻部分與來自聲子的比熱貢獻部分,研究來自電子的比熱貢獻部分隨溫度的變化時,實驗發現來自電子的比熱貢獻在超導臨界溫度(超導態<->一般態)時會發生不連續的變化,但是來自聲子的比熱貢獻在超導臨界溫度時則仍然是連續的,這表示超導態的產生是與電子系統的狀態是有關聯的,而非聲子系統!雖然超導態與電子的狀態有關,但是聲子仍然在超導現象中扮演著很重要的角色,因為我們發現超導臨界溫度會受到固體中原子的質量大小影響,實驗上,我們可以把超導體中的化學成分用相同化學成分,但不同質量的同位素取代,結果實驗發現超導臨界溫度會正比原子質量的負α次方,α的值大約是0.5(不同的超導体會有些微的差異),這種現象我們稱之為超導體的同位素效應,就超導研究歷史而言,我們可以說超導體的同位素效應指出了一可行的超導理論之方向。
事實上,比熱可以視為一種測量系統的entropy(亂度)隨溫度之變化率的方法
從實驗發現低於超導臨界溫度時,超導態的entropy下降的速率遠比一般態(我們使用將超導体質外加高於臨界磁場的方法使同一物體在低於無磁場的超導臨界溫度時處於一般態)的下降速率來得快,這一實驗結果暗示物體處於超導態時的電子系統比處於一般態時的電子系統來得更整齊有序。
在低溫時,超導體的比熱資料可以滿足型式,且和與溫度無關(低溫時),因此,比熱只是的函數,這種現象暗示著電子的能譜存在一個的能隙。
實驗顯示正比超導臨界溫度,在低溫時大約可以用近似。因此,雖然我們無法直接量測能隙,但我們可以肯定的是高溫超導體應該必須具有很大的能隙。
有一種方法或許可以量測超導體的能隙存在,那就是量測超導體對電磁波吸收(也就是光子的吸收),由於微波光子的能量比超導能隙還低,因此,雖然室溫時,一般態的金屬可以高度反射微波,但是如果我們把它降溫至低於超導臨界溫度,對微波而言,超導態的金屬會變成透明的,也就是說進入超導態的金屬不再吸收微波光子,可是一般態時卻會吸收微波光子,這表示這種能隙在一般態時並不存在。
(三)The
Meissner Effect
當我們將超導體置入磁場中時,超導體會受到磁場排斥,並且將磁力線排擠到超導體外部,這種現象並不是說外加磁場無法進入超導體內,而是當我們把超導體置入外加磁場中時,超導體內部馬上會產生一磁場與外加磁場護消抵銷,下圖顯示在同一物體在一般態時置入磁場中與進入超導態時置入磁場中磁力線在物體附近的分布圖。
當我們將超導體置入磁場中時,超導體會受到磁場排斥,並且將磁力線排擠到超導體外部,這種現象並不是說外加磁場無法進入超導體內,而是當我們把超導體置入外加磁場中時,超導體內部馬上會產生一磁場與外加磁場護消抵銷,下圖顯示在同一物體在一般態時置入磁場中與進入超導態時置入磁場中磁力線在物體附近的分布圖。
從這個圖形,我們可以發現磁力線繞過超導體表面附近的磁力線密度會遠比一般態時相同地方的磁力線密度。
然而,磁力線並非完全無法進入超導體(即使是型一的超導體),實驗發現磁場是隨著距超導體表面的深度作指數型衰減,磁場穿入的特徵深度大約是幾百埃左右。
在外磁場中的超導體內部為什麼磁場會等於零呢?這是由於放入外磁場中的超導體在其表面會感應出表面電流,表面電流產生的磁場抵銷了外磁場所致,但我們怎麼知道內部無電流,而是只有表面產生電流呢?因為根據穩態的馬克士威方程式 ,若超導體內部磁場為零,則內部電流密度也必須為零。
如果按照磁性來分類的話,超導體可以說是完美的反磁性物質,也就是說它的磁化率(susceptibility)是,下面我們可以簡單的利用馬克士威方程式導出超導體的磁化率,根據定義,磁偶矩密度,其中,注意這裡的是外加磁場的部分,又
將磁偶矩密度與外磁場關係式代入,並且因超導體內部磁場為零,因此,
超導體具有反磁性應該是很合理的現象,因為當我們把超導體置入加磁場中時,超導體感受到的磁場由無變有(磁場變化會產生感應電場),因此,根據法拉第電磁感應,超導體將被感應出感應電動勢與感應電流,但由於物體處於超導態,所以當場達到穩定值時,雖然感應電動勢會消失,但是感應電流並不會衰減為零,因此,超導體會出現反磁性現象。
(四)臨界磁場
當我們把超導體置入外磁場中時,如果當外磁場大到某一臨界值時,超導體的超導態會被破壞,物體將由原來的超導態轉變成一般態,我們稱此一磁場臨界值為臨界磁場,首先我將先討論第一型的超導體(type
1),我們可以用磁偶矩密度作為外加磁場的函數,並且將兩者關係作成一關係圖,如下圖所示,當外加磁場大到某一臨界值時,磁場會突然穿入超導體內,同時物體便從超導態轉變成一般態。
對於第一型的超導體,其臨界磁場是溫度的函數,除了在超導臨界溫度附近,臨界磁場幾乎是溫度的二次函數,如下圖所示。
現在我們要利用臨界磁場來估算發生超導轉變時物體的一單位體積的能量變化,考慮某一超導體在溫度為絕對零度時,利用逐漸提高外加磁場(從零開始),我們需要多少磁能才能將超導態轉變成一般態,因為改變物體一單位體積的磁偶極矩發生的變化,所需的能量是,但是對於第一型超導體而言,在超導體內,所以,對積分,從0積到,可得。
另外臨界磁場的存在使得超導體所能負載的電流有了限制,當超導體負載的電流所產生的感應磁場大到臨界磁場時,超導態便會被破壞,使物體轉變成一般態,例如,以一條圓形截面的長質導線而言,假設其負載電流I,導線截面半徑R,則根據馬克士威方程式積分可得,則導線內部距離中心軸處的磁場大小為,當這個值超過了臨界磁場,則其外圍區域將轉變成一般態, 如圖所示,外圍區域是的部分。
(五)第二型超導體
如果一個超導體存在兩個臨界磁場,,當外加磁場小於較小的臨界磁場,時,第二型超導體就像第一型超導體一般具有完美的反磁性,超導體內部磁場等於零,但是當外加磁場介於兩個臨界磁場之間時,超導體內部並非磁場等於零,而是處於所謂的vortex
state,這時內部處於一般態的部分就像一根根的細線般穿過超導態的部分,這些穿過超導體處於一般態之細線所在區域稱為vortex區,其磁偶矩密度與外加磁場的關係如下圖所示,
當外加磁場繼續增加,超導體內部的一般態細線的數目便一直增加,直到外加磁場達到,整塊超導體便完全轉變成一般態。
(六)超導理論簡介:BCS
theory
為何會出現超導態的物體總是一些在室溫時電阻很大的物體呢?為何室溫環境下那些低電阻的金屬(或者說導電性極佳的金屬),反而怎麼降溫都沒有出現超導態?按照我們的理論,電阻的產生一部份是來自電子受到聲子的散射,或者說電子與聲子發生交互作用,而導電性極佳的金屬就是因為電阻小,換句話說就是電子與聲子的交互作用是微弱的,這種現象可以提供BCS
theory 的產生線索—物體的超導態可能肇因於電子與聲子的交互作用!因此,電子與聲子之間交互作用弱的物質反而不易產生超導態!
(1)Cooper Pairs
根據BCS theory,超導態的形成有一基本條件那就是電子間必須存在一吸引力,那吸引力必須強到足以克服電子與電子之間的庫倫排斥力,當物體內兩電子之間存在一足以克服兩電子的庫倫排斥力時,兩電子便會形成根據BCS
theory,電子與電子之間的這種吸引力來自於電子與聲子的交互作用,如果用古典的模型來解釋可以下圖說明,
當一個電子通過晶格時,由於電子與晶格的交互作用,使得電子附近的帶正電離子會靠近電子,導致晶格瞬間局域極化,所以這一局部鄰域便會顯現出正電性,這時如果有往相反方向的電子通過便會受到局域極化的晶格之正電性所吸引,因此,兩電子便透過此一吸引力形成所謂的Cooper
Pair,根據此一理論,我們可以大概推估當兩電子形成Cooper
Pair時,兩電子的平均距離不可能太近,理由很簡單,兩電子太近的話,兩電子透過與晶格的交互作用所產生的等效吸引力將不足克服兩電子的庫倫排斥力!
若用量子力學的語言來說明,就是第一個電子改變了各頻率的晶格震盪中的聲子數目,而這些聲子再影響第二個電子的波函數。
當兩電子的波向量大小相等方向相反,且自旋反向時,這種吸引力最強。我們可以把一個Cooper Pair 視為單一粒子,其帶電量為,而其自旋為零,因此,這種粒子屬於玻色子,必須遵守Bose-Einstein
統計,這也是導致超導現象的主因,因為根據Bose-Einstein 統計,同一態被多少個粒子所佔據並無任何限制,所以這種Cooper
Pairs所組成的電子系統,其基態就是所有的Cooper Pairs都處於同一個最低的能態,在這種狀態下,晶格動量為零(零電流)。但是請注意並不是電子有成對(波向量大小相等,自旋反向)就可以產生超導性,重點是兩電子存在交互作用的吸引力(透過聲子),下面我們將論證這個事實。
無論這種吸引力交互作用有多弱,只要吸引力交互作用存在,則電子對的能量必定會下降,考慮一個在絕對零度的自由電子系統()因此,電子的波函數形如,而且在費米球內的態全部都被占滿,如果兩電子之間沒有吸引力交互作用,則波向量大小相等,方向相反的兩個電子,他們的波函數為,where 。當然這樣寫是不完整的,因為它只有兩電子相對距離為時的物理資訊,而沒有兩電子系統的質心運動資訊,因此,得到完整的波函數還要乘上一個兩電子的質心運動之波函數,但是因為兩電子的總動量為零,所以關於質心運動部分只是一個常數,後面我們討論到超導電流時,這一部分才會出現。
為了簡化計算,我們假設電子對都處於費米面上,所以在沒有吸引力存在時,它們的波向量都是,電子能量都是,但由於吸引力的存在,所以聲子會把兩電子所形成的電子對從某一電子對狀態散射成另一種電子對狀態,因此,電子對波函數必須是各種平面波的線性疊加。也就是
(1)
現在我們可以假設兩電子間的吸引力所造成的位能貢獻為,很合理的,我們可以假設它是兩電子之間的距離之函數。因此,我們可以寫下電子對的 equation:
(2)
其中是只作用在第一個電子的座標,而是因為吸引力存在所造成的能量變化量。
將(1)代入(2),我們可以得到
(3)
為了方便起見,我們可以令,代入上式,我們可以得到
(4)
把式(4)乘以,並對整個樣品作積分,假設樣品的體積是,
則 (5)
其中。
現在我們可以利用幾個條件來簡化計算,首先由於在費米球內部的態全部都填滿,因此,吸引力不可能把電子散射到費米球內部(也就是的態),所以對於,再者,因為吸引力是肇因於電子與聲子的交互作用,所以這種吸引力不可能把電子散射到能量大於的狀態,這裡的是聲子頻譜中角頻率最大值,現在我們以德拜角頻率來近似。在式子(5)中的求和, 或者都只能在從費米面開始厚度為的球殼之內。
只要 或者都在這個薄球殼之內,則我們可以把視為常數,其中因為是吸引力位能,所以必須是正數。
所以式子(5)變成
(6)
兩邊同時對求和,因為 ,所以式子(6)變成
(7)
使用態密度來把求和改成積分,由於一個Cooper
Pair中的兩電子自旋是相反方向,所以使用態密度必須注意只能考慮某一種自旋,不可以把自旋向上和向下全都計入考慮,否則就多算了狀態的數目,假設就是一般情形下電子態密度的一半,所以式子(7)可以改用積分計算
(8)
由於在的範圍內,幾乎沒有多大的變化,因此,我們可以近似的把它當作常數提到積分外面,
因此,我們已經證得當兩電子形成庫柏對時,它們的能量會比兩個自由電子對的能量來得下降,所以我們可以說庫柏對中的兩個電子處於"準"束縛態,為什麼說是準束縛態,而非真的束縛態呢?因為庫柏對中兩電子的能量相對於導電帶底部仍然是正的!
(2)超導基態
前面我們談的只是單一個庫柏對的能量問題,現在我們要進一步討論整個超導體的能量問題,由於所需數學較複雜,因此這裡我們僅作定性討論。
因為庫柏對中的電子波函數中包含在費米能階上自由電子態,所以這些電子並不會一直占據在費米能階上,有時這些在費米能階上的自由電子態是空的,因此,低於費米能階的自由電子便有被散射到這些空態上形成庫柏對,超導性是集體合作現象,當費米面附近的電子形成庫柏對時,會促使費米面內的電子也形成庫柏對,但是這樣的過程並不會持續無限的進行下去,因為如果低於費米能階的自由電子態空下來,則庫柏對中的電子可能會被散射到這些狀態上,因此降低了形成準束縛態的趨勢。
當超導體處於絕對零度時,在其費米面附近,部分占滿的狀態之能量範圍令為,注意這與一般態不同,一般態在絕對零度時,在費米面內全部填滿,但是費米面外完全是空的!
,在很小的極限下。
一般人會把解釋成破壞一個庫柏對平均一個電子所需要的能量,但這樣解釋很容易造成誤解,因為它是來自所有電子集體運動的一個物理參數,而非來自單一庫柏電子對。
當然這個式子並非對所有超導體都適用,例如像一些強耦合的超導體,其吸引力位能函數便非常複雜,因此,其形式也會有所不同。
另外我們還可以利用BCS theory導出在絕對零度時,物體的電子系統在超導態與一般態的能量差異如下:
(3)超導能隙
假如在一般態時,在費米面外的一個電子狀態能量是,則根據BCS
theory在超導態時對應的能階會變成
(9)
,而低於費米能階的狀態能量會變成
(10)
也就是說電子與聲子的交互作用會改變激發態的能階。
因此在絕對零度時高於費米能階的最低能階為(代入(9)),而低於費米能階的最大能階為(代入(10))。
所以要把一個電子從費米能階下激發到費米能階之上至少需要 ,在這個能隙上的電子都是未成對,因此我們稱之為一般電子,在能隙下的電子則稱為超導電子,當溫度介於絕對零度與超導臨界溫度之間時,系統中的電子是一般電子與超導電子的混合態,當到達絕對零度時,所有的電子變全部變成超導電子。
由於超導性的產生是因為電子與聲子的交互作用,因此我們可能會錯誤的以為超導能隙大約是的數量級以及超導臨界溫度大約是德拜溫度的數量級,這樣的話,很多物質在遠高於室溫就會具有超導性,根據BCS
theory
這個式子說明超導能隙越大,超導臨界溫度也越大,也就是說電子與聲子的交互作用越強的話,超導臨界溫度越大!這也說明了為何在一般態時電阻很大的物質反而可以形成比較高溫的超導體,因為電子與聲子的交互作用越強,一般態時的電阻越大。
(4)Cooper Pairs(庫柏對)的實驗證明-約瑟夫森振盪
物理學家約瑟夫森利用兩塊超導體A、B中間夾一層非常薄的絕緣體C,這樣的組成稱為約瑟夫森結,並把電源接到A和B,假設電源電壓V,則就會有頻率的電磁波從約瑟夫森結發射出來,由頻率式子中的可以看出這種現象顯然是因為庫柏電子對存在所造成的效應。
因為超導態時,所有的庫柏電子對不是零動量(沒有電流),不然就是具有相同的動量,當庫柏電子對通過絕緣體時,受到電壓的作用,因此兩塊超導體的庫柏電子對的能量相差了,相位發生變化,因此會發射出頻率的電磁波。
線代啟示錄
I seek not to know the answers, but to understand the questions.
海森堡不確定性原理的矩陣證明
本文的閱讀等級:高級
在量子力學裏,不確定性原理[1](uncertainty principle) 表明:粒子的位置與動量不可同時被確定,位置的不確定性 與動量的不確定性 遵守不等式
物理學家費曼 (Richard P. Feynman) 說[5]:
既然我們無法從直接經驗去尋找聯想量子世界的運行方式,物理學家選擇何種假設或模型,在很大的程度上取決於個人的想像力與信念。1925年海森堡思考著量子力學的建立基礎,他憶起愛因斯坦曾說[6]:「你的理論決定了你所觀察到的。」這句話啟發他換一個角度看待問題,之後他建議[4]:只有在實驗裏能夠測量到的物理量,稱為可觀察量 (observable),才可以用理論描述其物理行為。當然,並不是所有的物理學家都抱持相同的看法。量子力學的另一位創建者薛丁格 (Erwin Schrödinger) 起初也不認同海森堡的想法 (但很快地,薛丁格於1926年證明波力學與矩陣力學是量子力學的兩種等價描述[6])。儘管未獲得眾多同行的支持,海森堡、玻恩 (Max Born) 與約當 (Pascual Jordan) 仍於1925年共同創立矩陣力學[7](matrix mechanics),大膽假設關於運動的古典概念不適用於量子層級。在原子裏的電子並不是運動於明確的軌道,而是模糊不清,無法觀察到的軌域。海森堡棄絕任何涉及粒子運動軌道的詳細計算,因為運動軌道是無法直接觀察到的。他選擇另一條道路:專注於研究電子躍遷時,所發射的光的離散頻率和強度。他計算出代表位置和動量的無限矩陣,這些矩陣能夠正確地預測電子躍遷所發射出光波的強度[4]。
海森堡從電子轉移的現象歸納出矩陣力學的前提[7]:所有的可觀察物理量都可以用矩陣表示。矩陣的特徵值集合是該物理量可能出現的觀察值。對一般人來說,這絕對是一個聞所未聞的神秘主義。在經驗世界裏,我們頂多用一個隨機變數來表示可觀察量,譬如,投擲骰子可能出現的點數,可是觀察量本身怎麼會跟矩陣扯上關係?況且在工程科學中,矩陣不都是拿來表示線性系統嗎?但量子力學不同於過去的典範,物理學家總是各憑本事編造出許多奇怪的想法企圖描繪原子層次的行為。不論信與不信,我們暫且接受這個瘋狂的假設。因為實驗測量的結果是實數,Hermitian 矩陣的特徵值又都是實數 ( 是 Hermitian 若 ,見“特殊矩陣 (9):Hermitian 矩陣”),所以我們可以用 Hermitian 矩陣來代表可觀察量。例如,Hermitian 矩陣
有特徵值 ,說明 所代表的物理量僅能觀察到這三個值。如果實驗結果是某一特徵值,那麼對應的特徵向量表示在實驗測量之後的一瞬間物理系統所處的特徵狀態。(所謂特徵狀態代表甚麼意思呢?稍後說明。) Hermitian 矩陣的特徵向量是複向量,上例為 。這些特徵向量位於向量空間 ,但並不是永遠如此,只是剛巧物理量以 階矩陣表示而已。舉例來說,設想一個粒子在直線上自由運動,我們用矩陣 來代表它的位置。由於粒子可能在直線上的任何點,觀察值可以是 的無窮多個特徵值所成的集合其中任一元素 。這麼說來, 必定是一個無限矩陣 (即無限大階數的矩陣),此矩陣的行空間 (特徵向量存在的空間) 也是一個無限維的向量空間,它的正式名稱叫做 Hilbert 空間 (見 “從幾何向量空間到函數空間”)。在 Hilbert 空間中,向量具有無限維數,無限矩陣改稱為算子 (operator);我們仍然可以計算內積,因此向量長度與正交投影都有良好的定義。不過為方便解釋,以下我們只考慮有限維的幾何座標空間 ,讀者不妨想像 是一個極大的數或令 。
為了弄清楚海森堡的想法,我們必須知道 Hermitian 矩陣的一些基本性質。在一量子系統中,令 階 Hermitian 矩陣 代表一個可觀察量,其特徵值為 ,對應特徵向量 ,。這些特徵向量構成一組完整的標準正交基底 (orthonormal basis) ,也就是說,,,其中 是 Kronecker 記號, 若 , 若 (見“實對稱矩陣可正交對角化的證明”)。令 維複向量 代表量子系統處在的狀態,稱為量子態[8](quantum state)。若量子系統處在某個特徵狀態,,物理量 的觀察值即是特徵值 。但當量子系統不在特徵狀態時,,,量子態 又具有甚麼意義呢?將量子態 表示成
可知量子態 也滿足歸一性 。當系統處在量子態 ,如何計算可觀察量 的期望值呢?出乎意料外,答案是二次型 。使用特徵方程 ,可得
為簡化符號,可觀察量 在量子態 的期望值表示為
1925年,玻恩閱讀了海森堡的論文後,發現位置與動量無限矩陣有一個很顯著的關係──它們不可交換 (或說不互相對易)[4,7]。不確定性原理是下列不互相對易關係的直接結果:
其中最後一個等式係因量子態滿足歸一性 。根據內積性質 (見“內積的定義”),我們可以得到另一個表達式:
可得
定義一組新的位置矩陣和動量矩陣:
(1)
(2)
(3) , 是一純量,
可導出
我們發現 和 也遵守對易關係,以 取代 , 取代 ,即得
同樣地,。所以,
從以上推導我們知道不確定性原理並非源自實驗儀器的測量誤差,而是粒子內稟的量子性質,即位置與動量不互相對易關係。最後我引用維基百科關於不確定性原理「名稱」的一段論述當作本文的結語[1]:
註解:
[1] 維基百科:不確定性原理,見「名稱」一節。
[2] 普朗克常數 是量子力學的註冊商標,出現在普朗克關係式 ,其中 是粒子的能量, 是電磁波的頻率。普朗克常數與光速 和萬有引力常數 並稱為大自然的三個基本常數。詳見維基百科:普朗克常數。
[3] 關於海森堡 (Werner Heisenberg) 的生平介紹請見維基百科:維爾納‧海森堡。
[4] 維基百科:不確定性原理,見「歷史」一節。
[5] 費曼 (Richard P. Feynman) 著 Essentials of Physics Explained by Its Most Brilliant Teacher,中譯本《費曼的六堂Easy物理課》,師明睿譯,天下文化出版,2001年,頁153-155。
[6] 愛因斯坦對海森堡說的英譯文是:“It is the theory which decides what can be observed.” 見談測不準原理的起始,原標題是 Remarks on the Origin of the Relations of Uncertainty。
[7] 矩陣力學 (matrix mechanics) 是量子力學的一種表述形式,由海森堡、玻恩 (Max Born) 和約當 (Pascual Jordan) 於1925年提出。矩陣力學假設 (1) 所有的可觀察物理量都可以用 Hermitian 矩陣表示,(2) 一個物理量的觀察值是該矩陣的特徵值,(3) 一個物理系統的位置矩陣 與動量矩陣 滿足對易關係:。對易關係無法從古典物理推導出來,它是一個全新的假定,只有實驗才能確認它的真實性。見維基百科:矩陣力學。
[8] 量子態 (quantum state) 描述量子系統的狀態。在量子系統裏,量子態由所有可觀察量的機率分布所定義。見維基百科:量子態。
[9] 機率幅 (probability amplitude) 是一個描述粒子的量子行為的複函數。當描述粒子的位置時,機率幅是一個波函數,表達為位置的函數。在量子力學中,機率幅常用 表示, 則代表機率幅的機率密度函數。見維基百科:機率幅。
[10] 諾伊曼 (John von Neumann) 所著 Mathematical Foundations of Quantum Mechanics,1949年出版,頁233-235。
在量子力學裏,不確定性原理[1](uncertainty principle) 表明:粒子的位置與動量不可同時被確定,位置的不確定性 與動量的不確定性 遵守不等式
,
其中 , 是普朗克常數[2](Planck constant)。海森堡[3] (Werner Heisenberg) 在1927年發表的一篇論文裏,寫下
。
雖然他提到這公式可以從對易關係 (稍後將說明) 推導出來,但他並沒有寫出相關的數學論證,也沒有給予 和 確切的定義。同年,肯納德 (Earl Hesse Kennard) 首先證明不確定關係不等式,1929年羅伯森 (Howard Percy Robertson) 又從對易關係推導出相同的結論[4]。本文使用現代讀者熟悉的矩陣分析方法證明不確定性原理。由於我對量子力學幾乎一無所知,在提到相關知識的時候均盡量列舉引用出處以方便讀者參照查詢。文中若有錯誤,敬請不吝指正。物理學家費曼 (Richard P. Feynman) 說[5]:
量子力學所描述的,概括一切物質行為的細節,尤其對那些發生在原子尺度的部分特別管用。非常微小東西的行為,跟我們的直接經驗完全不同,它們的行為既非波動性質,亦非粒子性質。也不完全像雲、撞球檯上的球、或彈簧上的砝碼。總而言之,完全不像我們日常看見過的任何東西。隨後又補充解釋:
因為所有人生經歷、思維直覺,無不是從大尺度事物來的。我們的經驗會隨時提醒我們,大尺度事物會如何因應,但是微小尺度的事物所採取的因應方式迥然不同。所以我們學習它的時候,必須強迫自己用抽象或想像的方式,而絕不能到我們直接經驗中去尋找聯想。
既然我們無法從直接經驗去尋找聯想量子世界的運行方式,物理學家選擇何種假設或模型,在很大的程度上取決於個人的想像力與信念。1925年海森堡思考著量子力學的建立基礎,他憶起愛因斯坦曾說[6]:「你的理論決定了你所觀察到的。」這句話啟發他換一個角度看待問題,之後他建議[4]:只有在實驗裏能夠測量到的物理量,稱為可觀察量 (observable),才可以用理論描述其物理行為。當然,並不是所有的物理學家都抱持相同的看法。量子力學的另一位創建者薛丁格 (Erwin Schrödinger) 起初也不認同海森堡的想法 (但很快地,薛丁格於1926年證明波力學與矩陣力學是量子力學的兩種等價描述[6])。儘管未獲得眾多同行的支持,海森堡、玻恩 (Max Born) 與約當 (Pascual Jordan) 仍於1925年共同創立矩陣力學[7](matrix mechanics),大膽假設關於運動的古典概念不適用於量子層級。在原子裏的電子並不是運動於明確的軌道,而是模糊不清,無法觀察到的軌域。海森堡棄絕任何涉及粒子運動軌道的詳細計算,因為運動軌道是無法直接觀察到的。他選擇另一條道路:專注於研究電子躍遷時,所發射的光的離散頻率和強度。他計算出代表位置和動量的無限矩陣,這些矩陣能夠正確地預測電子躍遷所發射出光波的強度[4]。
海森堡從電子轉移的現象歸納出矩陣力學的前提[7]:所有的可觀察物理量都可以用矩陣表示。矩陣的特徵值集合是該物理量可能出現的觀察值。對一般人來說,這絕對是一個聞所未聞的神秘主義。在經驗世界裏,我們頂多用一個隨機變數來表示可觀察量,譬如,投擲骰子可能出現的點數,可是觀察量本身怎麼會跟矩陣扯上關係?況且在工程科學中,矩陣不都是拿來表示線性系統嗎?但量子力學不同於過去的典範,物理學家總是各憑本事編造出許多奇怪的想法企圖描繪原子層次的行為。不論信與不信,我們暫且接受這個瘋狂的假設。因為實驗測量的結果是實數,Hermitian 矩陣的特徵值又都是實數 ( 是 Hermitian 若 ,見“特殊矩陣 (9):Hermitian 矩陣”),所以我們可以用 Hermitian 矩陣來代表可觀察量。例如,Hermitian 矩陣
為了弄清楚海森堡的想法,我們必須知道 Hermitian 矩陣的一些基本性質。在一量子系統中,令 階 Hermitian 矩陣 代表一個可觀察量,其特徵值為 ,對應特徵向量 ,。這些特徵向量構成一組完整的標準正交基底 (orthonormal basis) ,也就是說,,,其中 是 Kronecker 記號, 若 , 若 (見“實對稱矩陣可正交對角化的證明”)。令 維複向量 代表量子系統處在的狀態,稱為量子態[8](quantum state)。若量子系統處在某個特徵狀態,,物理量 的觀察值即是特徵值 。但當量子系統不在特徵狀態時,,,量子態 又具有甚麼意義呢?將量子態 表示成
。
上式左乘 可得 ,此即 在 的正交投影值,或者說, 是 在 的成分或權重。量子態 的物理意義可以從組合權重 來解釋。量子力學稱複數 為機率幅[9](probability amplitude),原因是 即為觀察值 出現的機率。據此,量子態 的組合係數絕對值平方 表示在該狀態下,量子系統所有可能出現的觀察值 的機率分配,故有歸一性 。因為 是一標準正交集,
。
類似機率學的標準差 ,其中 是隨機變數 的期望值,我們定義可觀察量 在量子態 的不確定性 (uncertainty) 如下:
。
關於矩陣力學基礎知識的討論至此告一段落,不確定性原理的證明即將展開。1925年,玻恩閱讀了海森堡的論文後,發現位置與動量無限矩陣有一個很顯著的關係──它們不可交換 (或說不互相對易)[4,7]。不確定性原理是下列不互相對易關係的直接結果:
,
其中 是位置矩陣, 是動量矩陣, 是單位矩陣,。上式中, 稱為交換子 (commutator,或稱對易算符),定義為
。
注意,上述不互相對易關係僅適用於無限矩陣 (即量子力學的算符)。若 和 是 階有限矩陣,使用跡數循環不變性 (見“跡數的性質與應用”),
,
但 。在無限維空間,跡數未必定義完善,因為它不一定收斂。下面介紹的證法大致依循諾伊曼 (John von Neumann) 的推演方式[10]。第一個步驟設法創造一個引入交換子 的數學式。諾伊曼選擇了 。因為 和 是 Hermitian 矩陣,,,可得
,
其中 代表複數 的虛部。比較上面兩式,即有
。
為了產生不確定性關係,下一個步驟必須引進不等式。複數的絕對值大於或等於它的虛部,即 ,所以
。
接著分離不等式裡面的 和 。使用 Schwarz 不等式 (見“Schwarz 不等式”)
。
現在我們已經抵達整個推導過程的中途休息站,眼前的不等式是對易關係 的必然結果。海森堡不確定關係不等式與這個不等式有完全相同的形式,暗示我們剩下的工作不過就是將不確定性套入其中。定義一組新的位置矩陣和動量矩陣:
,
其中 和 分別代表在量子態 ,位置 和動量 的期望值。明顯地, 和 也是 Hermitian 矩陣。利用交換子運算法則 (見“交換子與可交換矩陣”):(1)
(2)
(3) , 是一純量,
可導出
。
這個不等式其實就是不確定性原理。何以如此?利用 , 和 的定義,
。
從以上推導我們知道不確定性原理並非源自實驗儀器的測量誤差,而是粒子內稟的量子性質,即位置與動量不互相對易關係。最後我引用維基百科關於不確定性原理「名稱」的一段論述當作本文的結語[1]:
有很久一段時間,不確定性原理被稱為「測不準原理」,但事實上,不確定性原理是類波系統內秉的性質,與測量準確不準確並沒有關係 (請查閱本條目稍後觀察者效應一節),因此,該譯名並未正確表達出這原理的內涵。另外,英語稱此原理為「Uncertainty Principle」,直譯為「不確定性原理」,並沒有「測不準原理」這種說法,其他語言與英語的情況類似,除中文外,並無「測不準原理」一詞。現今,在中國大陸的教科書中,該原理的正式譯名也已改為「不确定性原理」。
註解:
[1] 維基百科:不確定性原理,見「名稱」一節。
[2] 普朗克常數 是量子力學的註冊商標,出現在普朗克關係式 ,其中 是粒子的能量, 是電磁波的頻率。普朗克常數與光速 和萬有引力常數 並稱為大自然的三個基本常數。詳見維基百科:普朗克常數。
[3] 關於海森堡 (Werner Heisenberg) 的生平介紹請見維基百科:維爾納‧海森堡。
[4] 維基百科:不確定性原理,見「歷史」一節。
[5] 費曼 (Richard P. Feynman) 著 Essentials of Physics Explained by Its Most Brilliant Teacher,中譯本《費曼的六堂Easy物理課》,師明睿譯,天下文化出版,2001年,頁153-155。
[6] 愛因斯坦對海森堡說的英譯文是:“It is the theory which decides what can be observed.” 見談測不準原理的起始,原標題是 Remarks on the Origin of the Relations of Uncertainty。
[7] 矩陣力學 (matrix mechanics) 是量子力學的一種表述形式,由海森堡、玻恩 (Max Born) 和約當 (Pascual Jordan) 於1925年提出。矩陣力學假設 (1) 所有的可觀察物理量都可以用 Hermitian 矩陣表示,(2) 一個物理量的觀察值是該矩陣的特徵值,(3) 一個物理系統的位置矩陣 與動量矩陣 滿足對易關係:。對易關係無法從古典物理推導出來,它是一個全新的假定,只有實驗才能確認它的真實性。見維基百科:矩陣力學。
[8] 量子態 (quantum state) 描述量子系統的狀態。在量子系統裏,量子態由所有可觀察量的機率分布所定義。見維基百科:量子態。
[9] 機率幅 (probability amplitude) 是一個描述粒子的量子行為的複函數。當描述粒子的位置時,機率幅是一個波函數,表達為位置的函數。在量子力學中,機率幅常用 表示, 則代表機率幅的機率密度函數。見維基百科:機率幅。
[10] 諾伊曼 (John von Neumann) 所著 Mathematical Foundations of Quantum Mechanics,1949年出版,頁233-235。
[转载]矩阵的特征值的含义
|||
转载自:http://blog.163.com/prevBlogPerma.do?host=blank-dic&srl=3101862220098684345286&mode=prev
特征值就是那个矩阵所对应的一元多次方程组的根
特征值表示一个矩阵的向量被拉伸或压缩的程度,例如特征值为1111111111,则表示经过变换以后,向量没有被拉伸,在物理上表示做刚体运动,相当与整体框架做了变动,但内部结构没有变化.
量子力学中,矩阵代表力学量,矩阵的特征向量代表定态波函数,矩阵的特征植代表力学量的某个可能的观测值。
一个向量(或函数)被矩阵相乘,表示对这个向量做了一个线性变换。如果变换后还是这个向量本身乘以一个常数,这个常数就叫特征值。这是特征值的数学涵义;
至于特征值的物理涵义,根据具体情况有不同的解释。比如动力学中的频率,稳定分析中的极限荷载,甚至应力分析中的主应力
矩阵的特征值要想说清楚还要从线性变换入手,把一个矩阵当作一个线性变换在某一组基下的矩阵,最简单的线性变换就是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比,这样的一些非零向量就是特征向量,其实我们更关心的是特征向量,希望能把原先的线性空间分解成一些和特征向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中在研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理!
用matlab求矩阵最大特征值的特征向量
用函数[V,D]=eig(A)
矩阵D的对角元存储的是A的所有特征值,
而且是从小到大排列的
矩阵V的每一列存储的是相应的特征向量
所以应该是V的最后一个列
就是最大特征值的特征向量
特征向量-定义
特征值就是那个矩阵所对应的一元多次方程组的根
特征值表示一个矩阵的向量被拉伸或压缩的程度,例如特征值为1111111111,则表示经过变换以后,向量没有被拉伸,在物理上表示做刚体运动,相当与整体框架做了变动,但内部结构没有变化.
量子力学中,矩阵代表力学量,矩阵的特征向量代表定态波函数,矩阵的特征植代表力学量的某个可能的观测值。
一个向量(或函数)被矩阵相乘,表示对这个向量做了一个线性变换。如果变换后还是这个向量本身乘以一个常数,这个常数就叫特征值。这是特征值的数学涵义;
至于特征值的物理涵义,根据具体情况有不同的解释。比如动力学中的频率,稳定分析中的极限荷载,甚至应力分析中的主应力
矩阵的特征值要想说清楚还要从线性变换入手,把一个矩阵当作一个线性变换在某一组基下的矩阵,最简单的线性变换就是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比,这样的一些非零向量就是特征向量,其实我们更关心的是特征向量,希望能把原先的线性空间分解成一些和特征向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中在研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理!
用matlab求矩阵最大特征值的特征向量
用函数[V,D]=eig(A)
矩阵D的对角元存储的是A的所有特征值,
而且是从小到大排列的
矩阵V的每一列存储的是相应的特征向量
所以应该是V的最后一个列
就是最大特征值的特征向量
特征向量-定义
数学上,线性变换的特征向量(本征向量)是一个非退化的向量,其方向在该变换下不变。该向量在此变换下缩放的比例称为其特征值(本征值)。 图1给出了一幅图像的例子。一个变换通常可以由其特征值和特征向量完全描述。特征空间是相同特征值的特征向量的集合。
“特征”一词来自德语的eigen。1904年希尔伯特首先在这个意义下使用了这个词,更早亥尔姆霍尔兹也在相关意义下使用过该词。eigen一词可翻译为“自身的”,“特定于...的”,“有特征的”或者“个体的”—这强调了特征值对于定义特定的变换有多重要。
空间上的变换—如平移(移动原点),旋转,反射,拉伸,压缩,或者这些变换的组合;以及其它变换—可以通过它们在向量上的作用来显示。向量可以用从一点指向另一点的箭头来表示。
特征向量-性质(1)
变换的特征向量是指在变换下不变或者简单地乘以一个缩放因子的非零向量。
特征向量的特征值是它所乘的那个缩放因子。
特征空间就是由所有有着相同特征值的特征向量组成的空间,还包括零向量,但要注意零向量本身不是特征向量。
变换的主特征向量是对应特征值最大的特征向量。
特征值的几何重次是相应特征空间的维数。
有限维向量空间上一个变换的谱是其所有特征值的集合。
例如,三维空间旋转的特征向量是沿着旋转轴的一个向量,相应的特征值是1,相应的特征空间包含所有和该轴平行的向量。该特征空间是一个一维空间,因而特征值1的几何重次是1。特征值1是旋转的谱当中唯一的实特征值。
特征向量-参看:特征平面
例子
随着地球的自转,每个从地心往外指的箭头都在旋转,除了在转轴上的那些箭头。考虑地球在一小时自转后的变换:地心指向地理南极的箭头是这个变换的一个特征向量,但是从地心指向赤道任何一处的箭头不会是一个特征向量。因为指向极点的箭头没有被地球的自转拉伸,它的特征值是1。
另一个例子是,薄金属板关于一个固定点均匀伸展,使得板上每一个点到该固定点的距离翻倍。这个伸展是一个有特征值2的变换。从该固定点到板上任何一点的向量是一个特征向量,而相应的特征空间是所有这些向量的集合。
但是,三维几何空间不是唯一的向量空间。例如,考虑两端固定的拉紧的绳子,就像弦乐器的振动弦那样(图2.)。振动弦的原子到它们在弦静止时的位置之间的带符号那些距离视为一个空间中的一个向量的分量,那个空间的维数就是弦上原子的个数。
如果考虑绳子随着时间流逝发生的变换,它的特征向量,或者说特征函数(如果将绳子假设为一个连续媒介),就是它的驻波—也就是那些通过空气的传播让人们听到弓弦和吉他的拨动声的振动。驻波对应于弦的特定振动,它们使得弦的形状随着时间变化而伸缩一个因子(特征值)。和弦相关的该向量的每个分量乘上了一个依赖于时间的因子。驻波的振幅(特征值)在考虑到阻尼的情况下逐渐减弱。因此可以将每个特征向量对应于一个寿命,并将特征向量的概念和共振的概念联系起来。
特征向量-特征值方程
从数学上看,如果向量v与变换满足
则称向量v是变换的一个特征向量,λ是相应的特征值。其中是将变换作用于v得到的向量。这一等式被称作“特征值方程”。
假设是一个线性变换,那么v可以由其所在向量空间的一组基表示为:
其中vi是向量在基向量上的投影(即坐标),这里假设向量空间为n 维。由此,可以直接以坐标向量表示。利用基向量,线性变换也可以用一个简单的矩阵乘法表示。上述的特征值方程可以表示为:
但是,有时候用矩阵形式写下特征值方程是不自然甚或不可能的。例如在向量空间是无穷维的时候,上述的弦的情况就是一例。取决于变换和它所作用的空间的性质,有时将特征值方程表示为一组微分方程更好。若是一个微分算子,其特征向量通常称为该微分算子的特征函数。例如,微分本身是一个线性变换因为(若M和N是可微函数,而a和b是常数)
考虑对于时间t的微分。其特征函数满足如下特征值方程:
,
其中λ是该函数所对应的特征值。这样一个时间的函数,如果λ = 0,它就不变,如果λ为正,它就按比例增长,如果λ是负的,它就按比例衰减。例如,理想化的兔子的总数在兔子更多的地方繁殖更快,从而满足一个正λ的特征值方程。
该特征值方程的一个解是N = exp(λt),也即指数函数;这样,该函数是微分算子d/dt的特征值为λ的特征函数。若λ是负数,我们称N的演变为指数衰减;若它是正数,则称指数增长。λ的值可以是一个任意复数。因此d/dt的谱是整个复平面。在这个例子中,算子d/dt作用的空间是单变量可微函数的空间。该空间有无穷维(因为不是每一个可微函数都可以用有限的基函数的线性组合来表达的)。但是,每个特征值λ所对应的特征空间是一维的。它就是所有形为N = N0exp(λt)的函数的集合。N0是任意常数,也就在t=0的初始数量。
特征向量-谱定理
关于此话题更进一步的细节,见谱定理。
谱定理在有限维的情况,将所有可对角化的矩阵作了分类:它显示一个矩阵是可对角化的,当且仅当它是一个正规矩阵。注意这包括自共轭(厄尔米特)的情况。这很有用,因为对角化矩阵T的函数f(T)(譬如波莱尔函数f)的概念是清楚的。在采用更一般的矩阵的函数的时候谱定理的作用就更明显了。例如,若f是解析的,则它的形式幂级数,若用T取代x,可以看作在矩阵的巴拿赫空间中绝对收敛。谱定理也允许方便地定义正算子的唯一的平方根。
谱定理可以推广到希尔伯特空间上的有界正规算子,或者无界自共轭算子的情况。
特征向量-矩阵的特征值和特征向量
如上所述,谱定理表明正方形矩阵可以对角化当且仅当它是正规的。对于更一般的未必正规的矩阵,我们有类似的结果。当然在一般的情况,有些要求必须放松,例如酉等价性或者最终的矩阵的对角性。 所有这些结果在一定程度上利用了特征值和特征向量。下面列出了一些这样的结果:
舒尔三角形式表明任何酉矩阵等价于一个上三角矩阵;
奇异值分解定理, A = UΣV * 其中Σ为对角阵,而U,V为酉矩阵。A = UΣV * 的对角线上的元素非负,而正的项称为A的奇异值。这对非正方形矩阵也成立;
若当标准型,其中A = UΛU ? 1 其中Λ不是对角阵,但是分块对角阵,而U是酉矩阵。若当块的大小和个数由特征值的几何和代数重次决定。若当分解是一个基本的结果。从它可以立即得到一个正方形矩阵可以完全用它的特征值包括重次来表述,最多只会相差一个酉等价。这表示数学上特征值在矩阵的研究中有着极端重要的作用。
作为若当分解的直接结果,一个矩阵A可以“唯一”地写作A = S + N其中S可以对角化,N是幂零的(也即,对于某个q,Nq=0),而S和N可交换(SN=NS)。
任何可逆矩阵A可以唯一地写作A = SJ,其中S可对角化而J是么幂矩阵 (也即,使得特征多项式是(λ-1)的幂,而S和J可交换)。
特征向量-特征值的一些另外的属性
谱在相似变换下不变: 矩阵A和P-1AP有相同的特征值,这对任何矩阵A和任何可逆矩阵 P都成立。谱在转置之下也不变:矩阵A和AT有相同的特征值。
因为有限维空间上的线性变换是双射当且仅当它是单射,一个矩阵可逆当且仅当所有特征值都不是0。
若当分解的一些更多的结果如下:
一个矩阵是对角阵当且仅当代数和几何重次对于所有特征值都相等。特别的有,一个n×n矩阵如果有n不同特征值,则总是可以对角化的。
矩阵作用的向量空间可以视为其广义特征向量所撑成的不变子空间的直和。对角线上的每个块对应于该直和的一个子空间。若一个块是对角化的,其不变子空间是一个特征空间。否则它是一个广义特征空间,如上面所定义;
因为迹,也就是矩阵主对角线元素之和,在酉等价下不变,若当标准型说明它等于所有特征值之和;
类似的有,因为三角矩阵的特征值就是主对角线上的项,其行列式等于等于特征值的乘积(按代数重次计算出现次数)。
正规矩阵的一些子类的谱的位置是:
一个厄尔米特矩阵(A = A*)的所有特征值是实数。进一步的有,所有正定矩阵(v*Av > 0 for all vectors v)的所有特征值是正数;
所有斜厄尔米特矩阵(A = ?A*)的特征值是纯虚数;
所有酉矩阵(A-1 = A*)的特征值绝对值为1;
假设A是一个m×n矩阵,其中m ≤ n,而B是一个n×m矩阵。则BA有和AB相同的特征值加上n ? m个等于0的特征值。
每个矩阵可以被赋予一个算子范数。算子范数是其特征值的模的上确界,因而也是它的谱半径。该范数直接和计算最大模的特征值的幂法直接相关。当一个矩阵是正规的,其算子范数是其特征值的最大模,并且独立于其定义域的范数。
特征向量-共轭特征向量
一个共轭特征向量或者说共特征向量是一个在变换下成为其共轭乘以一个标量的向量,其中那个标量称为该线性变换的共轭特征值或者说共特征值。共轭特征变量和共轭特征值代表了和常规特征向量和特征值相同的信息和含义,但是在交替坐标系统被使用的时候出现。对应的方程是:
例如,在相干电磁散射理论中,线性变换A代表散射物体施行的作用,而特征向量表示电磁波的极化状态。在光学中,坐标系统按照波的观点定义,称为前向散射对齐 (FSA),从而导致了常规的特征值方程,而在雷达中,坐标系统按照雷达的观点定义,称为后向散射对齐 (BSA),从而给出了共轭特征值方程。
特征向量-广义特征值问题
一个广义特征值问题(第二种意义)有如下形式
其中A和B为矩阵。其广义特征值(第二种意义)λ 可以通过求解如下方程得到
形如A ? λB的矩阵的集合,其中λ是一个复数,称为一个“铅笔”。 若B可逆,则最初的问题可以写作如下形式
也即标准的特征值问题。但是,在很多情况下施行逆操作是不可取的,而广义特征值问题应该如同其原始表述来求解。
如果A和B是实系数的对称矩阵,则特征值为实数。这在上面的第二种等价表述中并不明显,因为矩阵B ? 1A未必是对称的。
这里的一个例子是分子轨道应用如下。
特征向量-系数为环中元素
在方矩阵A,其系数属于一个环的情况,λ称为一个右特征值如果存在一个列向量x使得Ax=λx,或者称为一个左特征值如果存在非零行向量y使得yA=yλ。
若环是可交换的,左特征值和右特征值相等,并简称为特征值。否则,例如当环是四元数集合的时候,它们可能是不同的。
若向量空间是无穷维的,特征值的概念可以推广到谱的概念。谱是标量λ的集合,对于这些标量,没有定义,也就是说它们使得没有有界逆。
很明显,如果λ是T的特征值,λ位于T的谱内。一般来讲,反过来并不成立。在希尔伯特空间或者巴拿赫空间上有一些算子完全没有特征向量。这可以从下面的例子中看到。 在希尔伯特空间(所有标量级数的空间,每个级数使得收敛)上的双向平移没有特征向量却有谱值。
在无穷维空间,有界算子的谱系总是非空的,这对无界自共轭算子也成立。通过检验谱测度,任何有界或无界的自共轭算子的谱可以分解为绝对连续,离散,和孤立部分。指数增长或者衰减是连续谱的例子,而振动弦驻波是离散谱例子。氢原子是两种谱都有出现的例子。氢原子的束缚态对应于谱的离散部分,而离子化状态用连续谱表示。图3用氯原子的例子作了解释。
特征向量-应用
一个变换用微分算子代表的特征值方程的例子是量子力学中的时不变薛定谔方程
HΨE = EΨE
其中H是哈密尔顿算子,一个二阶微分算子而ΨE是波函数,对应于特征值E的特征函数,该值可以解释为它的能量。
图4. 一个氢原子中的一个电子的束缚态所对应的波函数可以视为氢原子哈密尔顿算子的一个特征向量,也是角动量算子的一个特征向量。它们对应于可以解释为它们的能量(递增:n=1,2,3,...)和角动量(递增:s, p, d,...)的特征值。这里画出了波函数绝对值的平方。更亮区域对应于位置测度的更高概率密度。每幅图的中心都是原子核,一个质子但是,在这个情况我们只寻找薛定鄂方程的束缚态解,就像在量子化学中常做的那样,我们在平方可积的函数中寻找ΨE。因为这个空间是一个希尔伯特空间,有一个定义良好的标量积,我们可以引入一个基集合,在其中ΨE和H可以表示为一个一维数组和一个矩阵。这使得我们能够用矩阵形式表达薛定鄂方程。(图4代表氢原子哈密尔顿算子的最低能级特征函数。)
狄拉克记法经常在这个上下文中使用,以强调状态的向量和它的表示,函数ΨE之间的区别。在这个情况下,薛定鄂方程写作
并称是H的一个本征态(H有时候在入门级课本中写作),H被看作是一个变换(参看观测值)而不是一个它用微分算子术语进行的特定表示。在上述方程中,理解为通过应用H到得到的一个向量。
特征向量-分子轨道
在量子力学中,特别是在原子物理和分子物理中,在Hartree-Fock理论下,原子轨道和分子轨道可以定义为Fock算子的特征向量。相应的特征值通过Koopmans定理可以解释为电离势能。在这个情况下,特征向量一词可以用于更广泛的意义,因为Fock算子显式地依赖于轨道和它们地特征值。如果需要强调这个特点,可以称它为隐特征值方程。这样地方程通常采用迭代程序求解,在这个情况下称为自洽场方法。在量子化学中,经常会把Hartree-Fock方程通过非正交基集合来表达。这个特定地表达是一个广义特征值问题称为Roothaan方程。
特征向量-因子分析
在因素分析中,一个协变矩阵的特征向量对应于因素,而特征值是因素负载。因素分析是一种统计学技术,用于社会科学和市场分析、产品管理、运筹规划和其他处理大量数据的应用科学。其目标是用称为因素的少量的不可观测随机变量来解释在一些可观测随机变量中的变化。可观测随机变量用因素的线性组合来建模,再加上“残差项。
特征向量-特征脸是特征变量的例子特征脸
在图像处理中,脸部图像的处理可以看作分量为每个像素的辉度的向量。该向量空间的维数是像素的个数。一个标准化面部图形的一个大型数据集合的协变矩阵的特征向量称为特征脸。它们对于将任何面部图像表达为它们的线性组合非常有用。特征脸提供了一种用于识别目的的数据压缩的方式。在这个应用中,一般只取最大那些特征值所对应的特征脸。
特征向量-惯量张量
在力学中,惯量的特征向量定义了刚体的主轴。惯量是决定刚体围绕质心转动的关键数据。
特征向量-应力张量
在固体力学中,应力张量是对称的,因而可以分解为对角张量,其特征值位于对角线上,而特征向量可以作为基。因为它是对角阵,在这个定向中,应力张量没有剪切分量;它只有主分量。
特征向量-图的特征值
在谱系图论中,一个图的特征值定义为图的邻接矩阵A的特征值,或者(更多的是)图的拉普拉斯算子矩阵I ? T ? 1 / 2AT ? 1 / 2,其中T是对角阵表示每个顶点的度数,在T ? 1 / 2中,0用于取代0 ? 1 / 2。图的主特征向量用于测量其顶点的中心度。Google的PageRank算法就是一个例子。www图的修正邻接矩阵的主特征向量的分量给出了页面评分。
特征向量-备注
^ T. W Gorczyca, Auger Decay of the Photoexcited Inner Shell Rydberg Series in Neon, Chlorine, and Argon, 第18次X射线和内壳层进程国际会议的摘要,芝加哥,1999年8月23-27日。
^ 在这个上下文,只考虑从一个向量空间到自身的线性变换。
^ 因为所有线性变换保持零向量不变,它不作为一个特征向量。
No comments:
Post a Comment