矩陣與複數的類比
本文的閱讀等級:高級
定義於複數域的
階方陣代表
空間中的一個線性變換。除了少數特殊矩陣,如主對角矩陣、投影矩陣、旋轉矩陣,和反射矩陣等,學者經常無法清楚地掌握矩陣變換的確實行為,主要原因是人們很難想像高維度(
)向量空間,遑論向量在這些空間中的變換。欲洞察任意方陣的映射行為雖非易事,但也不是全然無跡可循,本文介紹一個認識矩陣行為的方法——透過矩陣與複數的類比來區分界定重要的特殊方陣。(對複矩陣陌生的讀者,請先閱讀背景文章 “從實數域到複數域”。)
複數域
和複向量空間
擁有許多相同的代數性質,例如,二者都有加法、乘法,運算規則,以及定義良好的加法單位元素
和乘法單位元素
(
空間則為零矩陣
和單位矩陣
),還有一項稱為共軛轉置。設
,
為
階複數方陣,
和
滿足下面這個性質:
和
,其中
,也就是
。以複矩陣的共軛轉置(
)與複數的共軛(
)類比,可以很容易明瞭複數方陣及其代表的線性變換具有何種作為與性質。(注意,純量的轉置即為其自身,
。)複數平面上最重要的幾個子集合包括:實數集、純虛數集、正實數集,和單位長複數所形成的集合,我們將分別討論對應這四個子集合的矩陣型態。
複數
必須滿足什麼條件方為實數?答案是
。仿照這個概念可以定義「若
,則方陣
是實的(real)。」不過沒有人會說「方陣是實的」,數學家稱它為“自伴”(self-adjoint)。自伴一詞不常出現在普通線性代數教科書裡;對於實矩陣,自伴其實就是我們熟悉的對稱(symmetric),複矩陣則叫做 Hermitian。以下我們提到 Hermitian,讀者就應將它與實數聯想在一起,這能幫助我們記得 Hermitian 矩陣的一些性質。譬如,若
和
是 Hermitian 矩陣,則
也是 Hermitian;若
是 Hermitian,則
也是Hermitian,但條件是純量
為實數;若可逆矩陣
是 Hermitian,
也是 Hermitian。那麼兩 Hermitian 矩陣的乘積是否仍為 Hermitian?不對。矩陣乘法是延伸代數法則時最常出錯的地方,正確的敘述應為:
若
和
是 Hermitian,則
或
為 Hermitian 的充要條件是
和
是可交換矩陣,即
。
證明如下:若
,則
。若
,則
。
複數
為純虛數的條件為何?答案是
。當然我們可以設想矩陣也有類似的陳述:「若
,則方陣
是純虛的(imaginary)。」數學家稱此性質為 skew,意思是“偏斜”,實矩陣和複矩陣的對應名稱分別是反對稱(或斜對稱)和 skew-Hermitian。既然任意複數
可表示為
,其中
,
為實數,很自然地,我們不免好奇:任意方陣是否可分解為
,其中
是 Hermitian,
,而
是 skew-Hermitian,
?或分解為
,其中
和
都是 Hermitian 矩陣?考慮
則
且
。令
,則
。這說明任意方陣都可以分解為 Hermitian 矩陣(對應複數的實部)與 skew-Hermitian 矩陣(對應複數的虛部)之和。
複數
為正實數的條件是什麼?
的條件是
可以表示為
,
為非零實數,或
可表為
,
為非零複數。“特殊矩陣(九):Hermitian 矩陣”曾經介紹:若
是 Hermitian,對於任意向量
,
是實數。利用此性質再加上前述兩個複數為正實數的條件,我們也可以想像「方陣
是正的(positive)」,如果以下任一條件成立:
(1)
,
為可逆 Hermitian 矩陣。
(2)
,
為可逆矩陣。
(3)
為 Hermitian,且對於任意非零向量
,
。
數學家最後選擇了條件 (3) 當作定義並稱它為正定(positive definite)。(正定矩陣的詳細討論請見“正定矩陣的性質與判別方法”。)事實上,上述三個條件是等價的,下面證明 (1)→(2)→(3)→(1)。若
且
,則
。若
,則
,而
,因
為可逆且
。若 (3) 成立,
的零空間僅有
,故
是可逆的;設
的奇異值分解為
,
,
,
和
,則
,由
得知
。令
,就有
很明顯,
是 Hermitian。
複數
的長度為
的條件是什麼?答案是
。同樣地,如果方陣
滿足
,也就有
,此式可以解讀為「長度等於
的矩陣」。若
為實矩陣,稱為正交(orthogonal)矩陣;若
為複矩陣,則稱為么正矩陣或酉矩陣(unitary)。類似單位長度的複數,
,么正矩陣也有三個等價的性質(見“特殊矩陣(三):么正矩陣(酉矩陣)”):
(1)
(2) 對於任意
和
,
。
(3) 對於任意
,
。
也就是說,么正矩陣所執行的線性變換不改變兩向量間的夾角,也不會改變向量長度。兩么正矩陣乘積亦為么正矩陣,么正矩陣的逆矩陣也為么正矩陣,這與複數性質相同。設
,
,則
,
。
最後一個問題:複數可以用極座標表示為
,
,
,那麼複矩陣是否也有對應的形式呢?有的,它稱為極分解(polar decomposition),形式如
(詳見“極分解”),
是半正定矩陣,
是么正矩陣;
對應複數的長度
,
對應單位圓上的旋轉量
。極分解可由奇異值分解推導而得。設
的奇異值分解為
,主對角矩陣
的主對角元皆不小於零,故
為半正定,且
,
,所以
其中
是 Hermitian 半正定,因
,而
亦為么正矩陣。補充一點,極分解也可表示為
,不難驗證
。
在複數平面上,與複數
相乘的意義是將長度拉伸
倍並旋轉
弧度。在向量空間
中,極分解
將線性變換
分解成拉伸
和旋轉
二部分。反過來說,從極分解也能推演出前述各個集合,做法仍是將極分解與複數極座標聯想在一起。
(1)
為實數的條件是
。若
,
是 Hermitian,因為
也是 Hermitian,前面曾經說明
要成立必須滿足乘法交換律
。
(2)
是純虛數的條件是
。若
,
是 skew-Hermitian,因為
是 Hermitian,
,故
的條件還要加上
。
(3)
為正實數的條件是
,即
。類比陳述
為半正定的條件是
,故
,所以得到
,我們說
是可酉對角化(unitarily diagonalizable),主對角奇異值矩陣
包含大於或等於零的主對角元。
(4)
為單位長的條件是
,因此
為么正矩陣的條件是
,或
,這說明了
的所有奇異值為
(但
的特徵值未必為
)。
不止矩陣可以和複數類比,矩陣的特徵值根本就與所類比的複數擁有相同的性質。Hermitian 矩陣的特徵值為實數(“特殊矩陣 (九):Hermitian 矩陣”),skew-Hermitian 矩陣的特徵值為純虛數(“特殊矩陣 (二):正規矩陣”),正定矩陣的特徵值為正實數(“特殊矩陣 (六):正定矩陣”),么正矩陣的特徵值其絕對值為
(“特殊矩陣 (三):么正矩陣(酉矩陣)”)。
最後我將矩陣與複數的類比整理如下(見下表):
■ Hermitian 矩陣
對應實數
;
■ Skew-Hermitian 矩陣
對應純虛數
;
■ 正定矩陣對應正實數
;
■ 么正矩陣
對應長度為
的複數
;
■ 極分解
對應複數的極座標表示
,半正定矩陣
對應長度
,么正矩陣
對應旋轉
。
定義於複數域的
複數域
複數
若
證明如下:若
複數
複數
(1)
(2)
(3)
數學家最後選擇了條件 (3) 當作定義並稱它為正定(positive definite)。(正定矩陣的詳細討論請見“正定矩陣的性質與判別方法”。)事實上,上述三個條件是等價的,下面證明 (1)→(2)→(3)→(1)。若
複數
(1)
(2) 對於任意
(3) 對於任意
也就是說,么正矩陣所執行的線性變換不改變兩向量間的夾角,也不會改變向量長度。兩么正矩陣乘積亦為么正矩陣,么正矩陣的逆矩陣也為么正矩陣,這與複數性質相同。設
最後一個問題:複數可以用極座標表示為
在複數平面上,與複數
(1)
(2)
(3)
(4)
不止矩陣可以和複數類比,矩陣的特徵值根本就與所類比的複數擁有相同的性質。Hermitian 矩陣的特徵值為實數(“特殊矩陣 (九):Hermitian 矩陣”),skew-Hermitian 矩陣的特徵值為純虛數(“特殊矩陣 (二):正規矩陣”),正定矩陣的特徵值為正實數(“特殊矩陣 (六):正定矩陣”),么正矩陣的特徵值其絕對值為
最後我將矩陣與複數的類比整理如下(見下表):
■ Hermitian 矩陣
■ Skew-Hermitian 矩陣
■ 正定矩陣對應正實數
■ 么正矩陣
■ 極分解
15 則回應給 矩陣與複數的類比
發表迴響

建議您把最後一段 “矩陣與複數的類比" 整理
改用 “表格" 方式來呈現,
可以讓讀者觀念更清晰。
謝謝!
複數、矩陣:在第一列
實數、Hermitian:第二列
純虛數、skew-Hermitian:第三列
正實數、正定:第四列
單位長、酉unitary:第五列
表格只有兩欄,字級可加大,會看得更清楚!
謝謝!!!!
回家用自己的Mac瀏覽,使用FireFox 3.6,表格看起來正常,等號及中文字也很清楚。
老師若考慮在不同作業系統、不同瀏覽軟體皆能良好呈現表格,
大概需要事先把表格的size縮小,這樣才不會在低解析度環境下,圖形被自動再縮小一次而影響解析度。
今天上午建議表格Transpose是一種方法,也許老師會有更好的方法來呈現。
以下是目前各學校使用的教科書,各班可能採用不同教科書。
Gilbert Strang, Introduction to linear algebra, 4th ed., Wellesley-Cambridge Press, 2009.(交大電機,清大電機)
Howard Anton, Elementary Linear Algebra, 9th ed., John Wiley & Sons, Inc, 2005.(交大電機)
Spence, Insel, and Friedberg, Elementary Linear Algebra, 2nd ed., Pearson Education, 2008. (交大電機資訊學士班,台大電機系)
Friedberg, Insel, and Spence, Linear Algebra, 4th Ed, Prentice Hall, 2003.(清大電機系)
google 及 ie8 —> 很清楚
firebox —> 不佳,字體破碎
你建議的方法我會再試試,謝謝。
但是ie6會有字體破碎之現象,等號變成減號。
謝謝老師!效率真好。
我將各類型矩陣的特徵值性質補充於後,並加註引用來源,之前做好的表也跟著修改了。
這樣,愈看愈有趣了!
是的。詳見’解讀複數特徵值’