什么是熵----=第二部分
2. Kolmogorov 熵 |
我們希望能用數學上的語言來描述這個問題。 首先讓我們來考慮定義在 [0,1] 上的函數 ,也就是
(見圖2-1),取 Lebesgue 測度 m 做為 [0,1] 上的測度, 令 為 [0,1] 上的一個劃分 (partition), 則 也是 [0,1] 上的一個劃分。 任給兩個劃分 和 ,令 為由下式定義的劃分
由此,我們則有 如此這般下去,我們會有
的劃分,這個劃分裡的每個區間 都有 2-n 的 Lebesgue 概率測度。 事實上,它和旋轉硬幣 n 次那個樣本空間裡的 2n 個基本事件是一一對應的。 拿 n=3 其中的一個簡單情況來看。把 這個區間左端的 寫成
然後將 這個區間和 011(第一次反面,第二次正面,第三次反面)對應。一般來說,我們可以把 這個區間左端的 寫成
其中 ak=0 或 1, k=1,…,n。這個區間對應的是旋轉硬幣 n 次, 出現 的基本事件。 總的來說,旋轉硬幣 n 次,2n 個基本事件, 大家的機率都是 2-n 的樣本空間,拿 和劃分 來描述, 則是:拿劃分 裡的 2n 個元素 做基本事件, 大家的 Lebesgue 概率測度都是 2-n 的樣本空間。 「已知旋轉硬幣第一次,第二次,…,第 n-1 次的結果, 那麼第 n 次會是正面或反面的不確定度是多少?」 的這一問題,拿 和劃分 來描述, 事實上是在問:已知 x,…,fn-1(x) 在劃分 裡的位置,那麼 fn(x) 會在 裡 或在 裡的不確定度是多少呢?
讓我們來看 n=4 這個特殊情形。比如說我們已知前三次的結果, 它們是 101(第一次正面,第二次反面,第三次正面),這在 中所對應的區間是,因為
仔細的看,這個間區事實上是, 和 以及 的交集,也就是說
元素x在這交集所代表的意義是: 和 。 一般說來,已知前三次旋轉硬幣的結果相當於已知 x,f(x),f2(x) 在劃分 中的位置。 問第四次是正面還是反面的不確定度,相當於問f3(x) 究竟是在 中還是在 中的不確定度。 已知 在那裡,問 fn(x) 在那裡的不確定度, 當 n 趨近於無窮大時的變化就是我們在這一節要談的 Kolmogorov 熵。
我們將把我們的著眼點放在一般的概率測度空間 (Probability measure space) 和定義在它上面的可測變換 (measurable function)。 設 為一概率測度空間。即 X 為一集合, Σ 為 X 上的一些子集合所構成的一個 代數, μ 為 Σ 上的概率測度,也就是說 。 假設 為一個可測變換。 這是指,Σ 中每個元素的逆像 f-1(A) 仍在 σ 中。 我們任取 X 的一個有限劃分 (finite partition) ,Am} 即 中每個集合 Ai 屬於 Σ, 它們之間互不相交(交集的測度為 0)且聯集恰為 X。 這樣 可看成具有「基本事件」 A1,A2,…,Am 且有概率分布 ,…, 的一個有限樣本空間。這個樣本空間經常被稱為「試驗結果」。上節中談到,這個「試驗結果」的 Shannon 熵應為:
對給定的 f,集族 也可給出 X 的一個劃分。首先我們要提出這樣的問題: 在試驗結果 為已知的前提下,試驗結果 f-1(An)} 的不確定度為多少?也就是說,我們欲知:已知 x 在 Ai 中, 問 f(x) 在何處的不確定度為多少? 我們可以從條件概率的角度來探討之。為簡單起見, 設 n=3,即 。 假如,已知 x 在 A1 中我們來看 f(x) 在 A1,A2 或 A3 的概率為如何。 對,當且僅當 , 故 x 在 A1 中且 f(x) 在 Ai 中之集合為 , 因而其條件概率為 。 由 Shannon 熵的定義知,在 的條件下, f(x) 會在 A1,或 A2,或 A3 的不確度應為
類似地,在 ,或 的條件下,試驗 結果 的不確定度應分別為
和
由推導 Shannon 熵定義的條件(ii)易知, 在試驗結果 為已知的條件下, 試驗結果 的不確定度 為H1,H2,H3的加權和,即
如法炮製,對一般的有限劃分 我們可得到所謂的「劃分 關於劃分 的條件 shannon 熵」,
下面,我們來給出上述 的另一等價型式以便後面推廣。
- 命題2-1:
- 證明:
上述已知試驗結果,問試驗結果f-1(A)的不確定度, 相當於已知x在中的位置, 我們問f(x)在中的位置的不確定度。 已知 在分劃中的位置, 問 fn(x) 在 中的位置的不確定度, 則相當於已知試驗結果 ,問試驗結果 的不確定度。 Kolomogorov 熵基本上是在刻劃這個不確定度在當 n 趨近於無窮大時的漸近性質。
任給自然數n, 和 都是 X 的有限劃分。 在已知試驗結果, 的條件下, 試驗結果 的不確定度, 實際上是劃分 的條件 Shannon 熵,它是
- 定義2-2:
- 設 為 X的有限劃分,則可測變換 關於 的熵定義為
- 定義2-3:
- 設 (X,Σ,μ) 為一概率空間, 為一可測變換, 則 f 的 Kolomogorov 熵定義為
- 定義2-2:
- 設 為 X 的有限劃分, 則保測變換 關於的熵定義為
- 引理2-4:
- 若 , 則
- 定理2-5:
- 若 為保測變換,則對 X 的任一劃分
- 證明:
- n=1,則
當 n=2 時,
用歸納法易證,一般地有
各式相加,我們有
故有
借用初等微積分的已知結果: ,我們得到
現在我們來證明引理2-4。 設 , , , 我們要證
只須證明對每一 i 和 j
令 , 則上式為
由於 是凸函數(這由 可知) 和假設 ,易知
即我們證明了 歷史上,引進 Kolmogorov 熵概念的主要動力是關於概率空間保測變換之間共軛關係的不變量的研究。 設 和 為兩個概率空間,和 為保測變換。 我們說 T1 和 T2 共軛 (conjugate) 是指存在一個保測同構 使得。 我們稱一個數量為共軛保測變換的「不變量 (invariance)」 是指二個保測變換若是共軛,這個數量一定一樣。 這個數量若不一樣,這兩個保測變換一定不共軛。 共軛的保測變換具有同樣的遍歷性質。 我們若能找到關於共軛保測變換的不變量,我們就可從本質上刻劃不同共軛類保測變換的特徵:Kolmogorov 熵就是這樣的一個重要的不變量。
早在1943年,人們就知道 Bernoulli 的 ( ) -雙邊移位算子 (two side shift) 和 ( )- 雙邊移位算子都具有可數個 Lebesgue 譜點,因而是譜同構的,但不知道它們是否共軛。 直到1958年才由 Kolmogorov 證明了它們分別具有 和 的 Kolmogorov 熵,故非共軛。從而消除了遍歷理論這個重大懸念,並開創了一個嶄新的研究領域。 我們這裡介紹的 Kolmogorov 熵的概念是由 Kolmogorov 的學生 Sinai 在1959年改進的,和 Kolmogorov 1958年給出的原始定義稍有不同。
No comments:
Post a Comment