(2013-05-29 23:20:58)
关于特征值和特征向量,我参考了一些教科书,有同济的,电子科大的,清华的,华东理工的,无一例外不是从Ap=λp开始的,同时又把它作为了一种理解特征值和特征向量的方法。利用定义去理解,通常不能理解实质。因为数学的公理化定义就不是让人去理解的,它的目的是为了数学的严谨。
有一定数学基础的都能知道,矩阵对于向量空间来说,既是“坐标”也是“变换”,也是“坐标”和“变换”描述的对象(矩阵可以看成多个向量的排列)。具有这种性质的原因在于,线性空间没有点的概念,所以它也叫向量空间。这是跟仿射空间最大的区别。所以对于点,我们只需要关注所有向量的起点,也就是原点,甚至忽略它。矩阵也是可以加减的。矩阵的加减其实就是坐标的平移或者向量的矢量和,平移完了之后仍旧是个不知道原点的坐标或者向量,所以我们只需要讨论基。
而在这样一个线性空间中,有几种最简单的变换形式呢?所谓最简单就是这种变换形式无法继续分解为其他的变换——我们现在碰到的线性空间在集合中存在的形式就是多项式,如果把多项式换成变换形式,或者换成更熟悉的名字“函数”,对于这个线性空间的研究就是非常牛逼的泛函分析——无非分为这几种,拉伸,旋转,翻转。我们所能接触到的所有线性变换都可以由这三个变换的线性排列(注意而不是组合)得到。而这三个最基本的变换也有相对应的最简单的一般矩阵形式。
1拉伸
a 0 0 …… 0
0 b 0 …… 0
0 0 c …… 0
0 0 0 …… x
(当然矩阵包括但不仅限a到x这24阶)
2旋转
最简单的二维旋转矩阵是
cosx –sinx
sinx cosx
这是绕着垂直于xOy面的轴旋转的变换矩阵。扩展到n维空间,我们不难想到,如果要向量绕着哪一个轴旋转,我只要找到和这个轴垂直的“平面”,再找到这个“平面”的正交基,把这一对正交基当作x轴和y轴,然后施以上述的旋转变换即可。多次旋转可多次叠加。以一次变换举例:
cosx 0 0 –sinx 0
0 cosx 0
这就是在第一维和第四维所在平面进行的旋转变换。
3翻转
翻转变换也有多种,无法举出一个通用式。举两个例子:
0 1
1 0
这是以x=y为对称轴进行翻转。
1 0
0 -1
这是以x轴为对称轴进行翻转。
跟旋转类似,多次翻转可多次叠加。
有了变换的概念就直接往下讲,碰到一些概念我会及时补充。
回过头思考这句话,一个矩阵可以是一个变换,也可以是一个坐标系,如果这个坐标系或基正交,当我用这个矩阵乘以一个向量时,如果这个向量也恰好在坐标系也就是基的一个向量所指的方向,那么这个矩阵乘以这个向量不就是把这个向量在那个基上伸缩了λ倍吗?λ就是这个矩阵的特征值。
可是,我们数一数上面有多少个如果——这个工作意义就是告诉大家,我们的想法是不是太理想——那我们放到更一般的情况,讨论某一个非奇异阵。讨论的时候我们换一个思路,上面的思考可能叙述太繁杂了,具体的说,求特征向量的关系,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。(例如A是m*n的矩阵,n>m,那么特征向量就是m个(因为秩最大是m),n个行向量在每个特征向量E上面有投影,其特征值v就是权重。那么每个行向量现在就可以写为Vn=(E1*v1n,E2*v2n...Em*vmn),矩阵变成了方阵。如果矩阵的秩更小,矩阵的存储还可以压缩。再: 由于这些投影的大小代表了A在特征空间各个分量的投影,那么我们可以使用最小2乘法,求出投影能量最大的那些分量,而把剩下的分量去掉,这样最大限度地保存了矩阵代表的信息,同时可以大大降低矩阵需要存储的维度,这叫主成分分析,或者主元分析,简称PCA方法,是一种重要的数学模型。)
这样就非常容易理解不同特征值的特征向量相互正交了,因为求特征向量就是一个正交化的过程,或者说是求某一个矩阵的基。
举个例子,对于x,y平面上的一个点(x,y),我对它作线性变换,
[1 0 ] [x]
[0 -1 ] [y]
那么得到的结果就是(x,-y),这个线性变换相当于关于横轴x做镜像。我们可以求出矩阵[1,0;0,-1]的特征向量有两个,[1,0]和[0,1],也就是x轴和y轴。什么意思呢? 在x轴上的投影,经过这个线性变换,没有改变。在y轴上的投影,乘以了幅度系数-1,并没有发生旋转。两个特征向量说明了这个线性变换矩阵对于x轴和y轴这两个正交基是线性不变的。对于其他的线性变换矩阵,我们也可以找到类似的,N个对称轴,变换后的结果,关于这N个对称轴线性不变。这N个对称轴就是线性变换A的N个特征向量。这就是特征向量的物理含义所在。所以,矩阵A等价于线性变换A。
再举一个例子:
[0 -1]
[1 0]
大家应该都能看出来,这是一个旋转矩阵,表示向量(x,y)绕原点逆时针旋转了pi/2。它的特征值是多少呢?λ=±i。而特征向量是这竟然是一个虚数。我们直观的思考一下,哪一个轴对于这个旋转变换来说是线性不变的?很明显是z轴。可这是一个二维空间。那么就把这个z轴叫做虚轴吧。但是如果我们把矩阵扩展一维,变成
[0 -1 0]
[1 0 0]
[0 0 1]
这时候再求特征值和特征向量,就会发现特征向量就是(0,0,1)也就是z轴。你看,添加了一维,它就不“虚”了。
(虚特征值不是这篇文章的重点,只是写的时候突然想到了这里。说到这里要提到之前写的“理解复变函数”,发现复变是个深坑,跳进去就找不到路了,概念过于繁杂,只能半年之后才有时间继续。)
虚轴的量有时候可以帮我们把一个没有实际物理形象的量添加到现实空间中。对于电气的学生,应该是要学交流传动的。里面有一个SVPWM电压空间矢量控制,对于电压空间矢量为什么会形成一个轨迹为圆形的磁链。我就是用二维的平面(顺着绕组方向)加了一个虚轴来证明的。这个可以另外讨论。
现在我们继续把讨论范围扩大。我们又特征多项式|λE-A|=0求到的特征值会有重根,这时候求到的这个重根的特征向量就不正交,甚至会线性相关。如果线性无关的话,那就直接把它正交化,问题就很轻松的解决了。即便正交后的结果不一样也没有关系,特征向量本身不是定死的,这就好比坐标系可以旋转一样。一旦特征向量的各个方向确定了,那么特征值向量也就确定了。至于为什么会有些矩阵的特征值会是重根,而且特征向量不正交,这个就要谈到线性方程组的解空间的问题了,足够再写一篇文章,因此不再赘述。
上面说到特征向量不正交的情况,再把讨论范围扩大,特征向量线性相关又怎么办。一句话就可以解释,描述这个变换的矩阵有一维或多维是冗余的,它的剩下的那些变换就足以描述你这个冗余的变换。这类似于向量组的线性无关性。可以想到,奇异阵是不能相似于对角阵的。
既然这个变换的矩阵有一维或者多维是冗余的,那么他就不能相似于一个对角阵。毕竟对n阶对角矩阵来说,它的秩是n,也就是说对角阵的变换无冗余,那你这个有冗余的矩阵也就不能描述这个对角阵。
矩阵对角化其实也是初等变换,但是是把矩阵再变回对角阵。这个对角阵也就是单位阵的不同的方向上进行了伸缩得到的。
所谓的特征矩阵,就是原矩阵如何与一个x维的数量矩阵相似。λ(i)说明了相似投影与一个x维线性空间的第i维坐标轴,λ(i)是放缩比例。λ(i)之间的顺序是不重要的,因为坐标轴之间的交换是初等线性变换,不影响代数拓扑的性质。特征向量xi表明A如何把线性组合投影到一个坐标轴上。所谓的特征向量,就是一组正交基集合。
2、线性代数的本质
线性代数(Linear Algebra),能否用一句话概括那些"线性方程组","线性相关","特征值和特征向量","对角化和相似","二次型和正交化",都是干了什么样的一件事情?
看下面几个矩阵:
[1,0] [2,0] [0,2] [1,-1] [1, 0]
[0,1],[0,3],[3,0],[1, 1],[1,-1]
我们可以通过计算来看出,上面5个矩阵:第一个矩阵是单位矩阵E,也就是把(x,y)映射到(x',y')保持不变;第二个矩阵映射以后变量的长度(或者叫模,1范数)有变换,向量的角度不变;第3个矩阵对调x/y轴,并且有伸缩;第4个矩阵把x/y逆时针旋转45度,模变成原来的根号2倍;第5个矩阵是对x轴做对称,把y变成-y。2维空间上的线性变换可以用复数乘法来替代,但是更高维的变换就只能借助于矩阵乘法。
矩阵的变换,换一个叫法就是映射。通过三个例子理解线性变换的映射。
(1) 线性方程组AX=B,也就是说,B是x'/y'坐标系一个向量(b1,b2,b3...bn),矩阵A是(x/y)到(x'/y')的映射,能否找到X=(x1,...xn)使得X被映射到B。如果找到了一个,那么这个映射就是唯一的,当然映射也可能没有,也可能有无数种可能的情况。
(2) 那么,什么情况AX=B的解是唯一的呢? 满足行列式|A|!=0。为了满足|A|!=0,必须有a的行向量线性无关,也就是a的每一行都是一个独立的坐标轴,没有冗余的坐标轴。所以坐标系映射的自变量和因变量也就因此一一对应,所以总是有且只有一个解。
(3) 什么情况下无解呢? A的行向量有冗余,最大线性无关(无冗余的坐标系个数),或者秩R(A)=r,但是发现需要通过r个坐标轴的映射,得到s维的映射结果(s>r)。显然无解(找不到低维到高维的一一映射)。同理,如果s,那么有无数个解(通解,一对多的映射),s=r正好也是一个解。
矩阵的对角化,揭示了矩阵作为一种线性变换的手段的本质。那么特征值和特征向量的意义,也就很明显了。假设N维坐标系(i1,i2...in)映射到新的坐标系(j1,j2,j3...jn),既然矩阵A代表一种映射关系(变换),那么这种映射关系可以分解为模的伸缩和角度旋转。A=P^(-1)*B*P,B是特征值构成的矩阵,那么每一个特征值,相当于坐标ix映射到jx的那一维的坐标,其模的伸缩比例是多少。可逆矩阵P的每一个列向量代表的就是新的坐标系相当于原有的坐标系如何投影过来----Pi的每一个分量就是(i1...in)在ji上面投影的大小。矩阵对角阵的分解式A=P^(-1)*B*P代表了这样一种信息: 把原坐标系(i1,i2...in)进行旋转(P矩阵),并且幅度进行伸缩(B矩阵),再做一次镜像的旋转P^(-1),因为旋转本身不具有翻转的功能,那么就是原矩阵A的线性变换功能的全部了。
矩阵,就是旋转+镜像翻转+尺度伸缩。这就是一切线性代数和矩阵理论要研究的问题,无出其外。
一个应用的例子就是控制论,系统从状态A变换到状态B(A和B都是矢量)其实就是看是否存在转移矩阵X使得XA=B,或者一些列转移矩阵{X}已知,看看是否存在初始A使得系统状态能够变成要求的状态B,或者已知A和{X}看是否能经过一系列变换得到B。下面几幅图来自<<Visual Complex Analysis>>,画的是复数域(2x2线性变换空间的)的尺度拉伸,平移,旋转,直角平面和极坐标圆平面之间的线性变换。
3、关于正交
正交可以理解为向量的内积为0,也可以理解为向量夹角90度。但是放到线性代数这个大概念,怎么把正交的定义和线性代数的各种概念形成自洽。那就是在某个线性空间中,基为a1,a2,a3……an,某个向量v在各个ax(1≤x≤n)上面的投影分解,表达式唯一或者表述为,a1-an当中的任意向量,在其他向量上面的投影都是0。
其实正交的概念放到不同的地方内涵完全可以不一样。例如在傅立叶级数中,为什么选用cos和sin作为分解的基,正是因为正余弦函数的正交性。
考虑y=f(x)(周期为T)的傅立叶级数展开形式----它相当于,在一个T内f(x)是无穷维向量(y1,y2,y3,...,yn...),f(x)的傅立叶级数展开式就是f(x)在无穷维正交基(e^jnw)上面有投影,这个正交基是从低频到高频的一些列三角函数组合。每一个投影的系数是一个长度。那么e^jnw组成的正交基就是的任何f(x)的特征向量,不同的是,不同f(x)对应不同的特征值向量。一个N维的向量空间,N个正交矢量不是定死的,而可以是任意的向量值组合,只要保持互相两两正交就可以了。例如我想构造3维的正交基,我随手写下 (1,0,1),那么(0,1,2),(0,0,1)就可以是剩下的两个向量。为什么?一般的说,向量e1,e2,e3是正交基,那么 e1+e2,e2+e3,e1+e3这三个向量也可以构成正交基。
也就是因为三角级数本身可以作为投影的基准,可以分解任何函数。所以三角函数就是特征向量函数,频率分析的值就是特征值。说得远一点,任何数学分析最后都可以用频谱分析来代替。这也就是"信号与系统","数字信号处理","通信原理","概率和随机过程"这些课程,怎么看起来都是在玩频率游戏和功率谱游戏的原因----学完以后经常会感觉自己什么都没有学会。因为在物理层,信息的"意义"并不存在,只有传输和设计的电子/数学特性有意义。通信协议都是高层次的东西,和"通信原理"无关。在底层只有物理意义,没有逻辑意义。
任一直角坐标变换总可以分解成移轴(也叫坐标平移)和转轴(也叫坐标旋转)两个步骤
也叫坐标平移)和转轴(也叫坐标旋转)两个步骤
http://jpkc.xxu.edu.cn/xiaonei09/%E8%A7%A3%E6%9E%90%E5%87%A0%E4%BD%95/%E8%A7%A3%E6%9E%90%E5%87%A0%E4%BD%95%E7%B2%BE%E5%93%81%E8%AF%BE%E7%A8%8B%E7%94%B3%E6%8A%A5%E6%9D%90%E6%96%99/%E8%A7%A3%E6%9E%90%E5%87%A0%E4%BD%95%E7%BD%91%E7%AB%99/Skin/secondpage/Skin2/zcr-56.htm
角动量为0的波函数是一个中心对称的圆球,在任何方向没有极化。
[PPT]二次曲线的直径 - 浙江师范大学网络课程
为转轴公式,其中α为坐标轴的旋转角. ... 用转轴消去交叉项 ... 直径; 主直径(对称轴) ; 切线; 二次曲线:曲线(椭圆,双曲线,抛物线);直线(两相交,两平行,两重合);点.
設一橢圓通過(2,-1),(2,-3),(0,-1),(1,0)四點,且一對稱軸平行於x軸,試求此橢圓之方程式. <<>> .... 轉軸一個銳角 ,求曲線 之新方程式,並作出 的圖形. <<>> ... 設二次曲線 ,若將原坐標系旋轉一銳角 ,使新方程式中不含交叉項,則新方程式為何?
显然,主直径是二次曲线的对称轴(简称轴). ... 消去交叉项,即xy项,然后再通过移轴 ... 先进行移轴消去一次项,然后再转轴消去其交叉项最终把曲线方程化为最简的形式.
有一定数学基础的都能知道,矩阵对于向量空间来说,既是“坐标”也是“变换”,也是“坐标”和“变换”描述的对象(矩阵可以看成多个向量的排列)。具有这种性质的原因在于,线性空间没有点的概念,所以它也叫向量空间。这是跟仿射空间最大的区别。所以对于点,我们只需要关注所有向量的起点,也就是原点,甚至忽略它。矩阵也是可以加减的。矩阵的加减其实就是坐标的平移或者向量的矢量和,平移完了之后仍旧是个不知道原点的坐标或者向量,所以我们只需要讨论基。
而在这样一个线性空间中,有几种最简单的变换形式呢?所谓最简单就是这种变换形式无法继续分解为其他的变换——我们现在碰到的线性空间在集合中存在的形式就是多项式,如果把多项式换成变换形式,或者换成更熟悉的名字“函数”,对于这个线性空间的研究就是非常牛逼的泛函分析——无非分为这几种,拉伸,旋转,翻转。我们所能接触到的所有线性变换都可以由这三个变换的线性排列(注意而不是组合)得到。而这三个最基本的变换也有相对应的最简单的一般矩阵形式。
1拉伸
a 0 0 …… 0
0 b 0 …… 0
0 0 c …… 0
0 0 0 …… x
(当然矩阵包括但不仅限a到x这24阶)
2旋转
最简单的二维旋转矩阵是
cosx –sinx
sinx
这是绕着垂直于xOy面的轴旋转的变换矩阵。扩展到n维空间,我们不难想到,如果要向量绕着哪一个轴旋转,我只要找到和这个轴垂直的“平面”,再找到这个“平面”的正交基,把这一对正交基当作x轴和y轴,然后施以上述的旋转变换即可。多次旋转可多次叠加。以一次变换举例:
cosx 0
0 0 0 0 0
0 0 0 0 0
sinx 0 这就是在第一维和第四维所在平面进行的旋转变换。
3翻转
翻转变换也有多种,无法举出一个通用式。举两个例子:
0 1
1 0
这是以x=y为对称轴进行翻转。
1
0 -1
这是以x轴为对称轴进行翻转。
跟旋转类似,多次翻转可多次叠加。
有了变换的概念就直接往下讲,碰到一些概念我会及时补充。
1. 特征值的数学意义
我们先考察一种线性变化,例如x,y坐标系的椭圆方程可以写为x^2/a^2+y^2/b^2=1,那么坐标系关于原点做旋转以后,椭圆方程就要发生变换。我们可以把原坐标系的(x,y)乘以一个矩阵,得到一个新的(x',y')的表示形式,写为算子的形式就是M*(x,y) =(x',y')。这里的矩阵M代表一种线性变换:拉伸,平移,旋转。那么,有没有什么样的线性变换b(b是一个向量),使得变换后的结果,看起来和让M*(x,y)像是一个数b乘以了一个(x,y)? 换句话说,有没有这样的矢量b,使得矩阵A*b这样的线性变换相当于A在矢量b上面的投影m*b? 如果有,那么b就是A的一个特征向量,m就是对应的一个特征值。回过头思考这句话,一个矩阵可以是一个变换,也可以是一个坐标系,如果这个坐标系或基正交,当我用这个矩阵乘以一个向量时,如果这个向量也恰好在坐标系也就是基的一个向量所指的方向,那么这个矩阵乘以这个向量不就是把这个向量在那个基上伸缩了λ倍吗?λ就是这个矩阵的特征值。
可是,我们数一数上面有多少个如果——这个工作意义就是告诉大家,我们的想法是不是太理想——那我们放到更一般的情况,讨论某一个非奇异阵。讨论的时候我们换一个思路,上面的思考可能叙述太繁杂了,具体的说,求特征向量的关系,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。(例如A是m*n的矩阵,n>m,那么特征向量就是m个(因为秩最大是m),n个行向量在每个特征向量E上面有投影,其特征值v就是权重。那么每个行向量现在就可以写为Vn=(E1*v1n,E2*v2n...Em*vmn),矩阵变成了方阵。如果矩阵的秩更小,矩阵的存储还可以压缩。再: 由于这些投影的大小代表了A在特征空间各个分量的投影,那么我们可以使用最小2乘法,求出投影能量最大的那些分量,而把剩下的分量去掉,这样最大限度地保存了矩阵代表的信息,同时可以大大降低矩阵需要存储的维度,这叫主成分分析,或者主元分析,简称PCA方法,是一种重要的数学模型。)
这样就非常容易理解不同特征值的特征向量相互正交了,因为求特征向量就是一个正交化的过程,或者说是求某一个矩阵的基。
举个例子,对于x,y平面上的一个点(x,y),我对它作线性变换,
[1
[0 -1 ] [y]
那么得到的结果就是(x,-y),这个线性变换相当于关于横轴x做镜像。我们可以求出矩阵[1,0;0,-1]的特征向量有两个,[1,0]和[0,1],也就是x轴和y轴。什么意思呢? 在x轴上的投影,经过这个线性变换,没有改变。在y轴上的投影,乘以了幅度系数-1,并没有发生旋转。两个特征向量说明了这个线性变换矩阵对于x轴和y轴这两个正交基是线性不变的。对于其他的线性变换矩阵,我们也可以找到类似的,N个对称轴,变换后的结果,关于这N个对称轴线性不变。这N个对称轴就是线性变换A的N个特征向量。这就是特征向量的物理含义所在。所以,矩阵A等价于线性变换A。
再举一个例子:
[0 -1]
[1
大家应该都能看出来,这是一个旋转矩阵,表示向量(x,y)绕原点逆时针旋转了pi/2。它的特征值是多少呢?λ=±i。而特征向量是这竟然是一个虚数。我们直观的思考一下,哪一个轴对于这个旋转变换来说是线性不变的?很明显是z轴。可这是一个二维空间。那么就把这个z轴叫做虚轴吧。但是如果我们把矩阵扩展一维,变成
[0 -1 0]
[1
[0
这时候再求特征值和特征向量,就会发现特征向量就是(0,0,1)也就是z轴。你看,添加了一维,它就不“虚”了。
(虚特征值不是这篇文章的重点,只是写的时候突然想到了这里。说到这里要提到之前写的“理解复变函数”,发现复变是个深坑,跳进去就找不到路了,概念过于繁杂,只能半年之后才有时间继续。)
虚轴的量有时候可以帮我们把一个没有实际物理形象的量添加到现实空间中。对于电气的学生,应该是要学交流传动的。里面有一个SVPWM电压空间矢量控制,对于电压空间矢量为什么会形成一个轨迹为圆形的磁链。我就是用二维的平面(顺着绕组方向)加了一个虚轴来证明的。这个可以另外讨论。
现在我们继续把讨论范围扩大。我们又特征多项式|λE-A|=0求到的特征值会有重根,这时候求到的这个重根的特征向量就不正交,甚至会线性相关。如果线性无关的话,那就直接把它正交化,问题就很轻松的解决了。即便正交后的结果不一样也没有关系,特征向量本身不是定死的,这就好比坐标系可以旋转一样。一旦特征向量的各个方向确定了,那么特征值向量也就确定了。至于为什么会有些矩阵的特征值会是重根,而且特征向量不正交,这个就要谈到线性方程组的解空间的问题了,足够再写一篇文章,因此不再赘述。
上面说到特征向量不正交的情况,再把讨论范围扩大,特征向量线性相关又怎么办。一句话就可以解释,描述这个变换的矩阵有一维或多维是冗余的,它的剩下的那些变换就足以描述你这个冗余的变换。这类似于向量组的线性无关性。可以想到,奇异阵是不能相似于对角阵的。
既然这个变换的矩阵有一维或者多维是冗余的,那么他就不能相似于一个对角阵。毕竟对n阶对角矩阵来说,它的秩是n,也就是说对角阵的变换无冗余,那你这个有冗余的矩阵也就不能描述这个对角阵。
矩阵对角化其实也是初等变换,但是是把矩阵再变回对角阵。这个对角阵也就是单位阵的不同的方向上进行了伸缩得到的。
所谓的特征矩阵,就是原矩阵如何与一个x维的数量矩阵相似。λ(i)说明了相似投影与一个x维线性空间的第i维坐标轴,λ(i)是放缩比例。λ(i)之间的顺序是不重要的,因为坐标轴之间的交换是初等线性变换,不影响代数拓扑的性质。特征向量xi表明A如何把线性组合投影到一个坐标轴上。所谓的特征向量,就是一组正交基集合。
2、线性代数的本质
线性代数(Linear Algebra),能否用一句话概括那些"线性方程组","线性相关","特征值和特征向量","对角化和相似","二次型和正交化",都是干了什么样的一件事情?
看下面几个矩阵:
[1,0]
[0,1],[0,3],[3,0],[1, 1],[1,-1]
矩阵的变换,换一个叫法就是映射。通过三个例子理解线性变换的映射。
(1) 线性方程组AX=B,也就是说,B是x'/y'坐标系一个向量(b1,b2,b3...bn),矩阵A是(x/y)到(x'/y')的映射,能否找到X=(x1,...xn)使得X被映射到B。如果找到了一个,那么这个映射就是唯一的,当然映射也可能没有,也可能有无数种可能的情况。
(2) 那么,什么情况AX=B的解是唯一的呢? 满足行列式|A|!=0。为了满足|A|!=0,必须有a的行向量线性无关,也就是a的每一行都是一个独立的坐标轴,没有冗余的坐标轴。所以坐标系映射的自变量和因变量也就因此一一对应,所以总是有且只有一个解。
(3) 什么情况下无解呢? A的行向量有冗余,最大线性无关(无冗余的坐标系个数),或者秩R(A)=r,但是发现需要通过r个坐标轴的映射,得到s维的映射结果(s>r)。显然无解(找不到低维到高维的一一映射)。同理,如果s,那么有无数个解(通解,一对多的映射),s=r正好也是一个解。
矩阵的对角化,揭示了矩阵作为一种线性变换的手段的本质。那么特征值和特征向量的意义,也就很明显了。假设N维坐标系(i1,i2...in)映射到新的坐标系(j1,j2,j3...jn),既然矩阵A代表一种映射关系(变换),那么这种映射关系可以分解为模的伸缩和角度旋转。A=P^(-1)*B*P,B是特征值构成的矩阵,那么每一个特征值,相当于坐标ix映射到jx的那一维的坐标,其模的伸缩比例是多少。可逆矩阵P的每一个列向量代表的就是新的坐标系相当于原有的坐标系如何投影过来----Pi的每一个分量就是(i1...in)在ji上面投影的大小。矩阵对角阵的分解式A=P^(-1)*B*P代表了这样一种信息: 把原坐标系(i1,i2...in)进行旋转(P矩阵),并且幅度进行伸缩(B矩阵),再做一次镜像的旋转P^(-1),因为旋转本身不具有翻转的功能,那么就是原矩阵A的线性变换功能的全部了。
矩阵,就是旋转+镜像翻转+尺度伸缩。这就是一切线性代数和矩阵理论要研究的问题,无出其外。
一个应用的例子就是控制论,系统从状态A变换到状态B(A和B都是矢量)其实就是看是否存在转移矩阵X使得XA=B,或者一些列转移矩阵{X}已知,看看是否存在初始A使得系统状态能够变成要求的状态B,或者已知A和{X}看是否能经过一系列变换得到B。下面几幅图来自<<Visual Complex Analysis>>,画的是复数域(2x2线性变换空间的)的尺度拉伸,平移,旋转,直角平面和极坐标圆平面之间的线性变换。
3、关于正交
正交可以理解为向量的内积为0,也可以理解为向量夹角90度。但是放到线性代数这个大概念,怎么把正交的定义和线性代数的各种概念形成自洽。那就是在某个线性空间中,基为a1,a2,a3……an,某个向量v在各个ax(1≤x≤n)上面的投影分解,表达式唯一或者表述为,a1-an当中的任意向量,在其他向量上面的投影都是0。
其实正交的概念放到不同的地方内涵完全可以不一样。例如在傅立叶级数中,为什么选用cos和sin作为分解的基,正是因为正余弦函数的正交性。
考虑y=f(x)(周期为T)的傅立叶级数展开形式----它相当于,在一个T内f(x)是无穷维向量(y1,y2,y3,...,yn...),f(x)的傅立叶级数展开式就是f(x)在无穷维正交基(e^jnw)上面有投影,这个正交基是从低频到高频的一些列三角函数组合。每一个投影的系数是一个长度。那么e^jnw组成的正交基就是的任何f(x)的特征向量,不同的是,不同f(x)对应不同的特征值向量。一个N维的向量空间,N个正交矢量不是定死的,而可以是任意的向量值组合,只要保持互相两两正交就可以了。例如我想构造3维的正交基,我随手写下 (1,0,1),那么(0,1,2),(0,0,1)就可以是剩下的两个向量。为什么?一般的说,向量e1,e2,e3是正交基,那么 e1+e2,e2+e3,e1+e3这三个向量也可以构成正交基。
也就是因为三角级数本身可以作为投影的基准,可以分解任何函数。所以三角函数就是特征向量函数,频率分析的值就是特征值。说得远一点,任何数学分析最后都可以用频谱分析来代替。这也就是"信号与系统","数字信号处理","通信原理","概率和随机过程"这些课程,怎么看起来都是在玩频率游戏和功率谱游戏的原因----学完以后经常会感觉自己什么都没有学会。因为在物理层,信息的"意义"并不存在,只有传输和设计的电子/数学特性有意义。通信协议都是高层次的东西,和"通信原理"无关。在底层只有物理意义,没有逻辑意义。
任一直角坐标变换总可以分解成移轴(也叫坐标平移)和转轴(也叫坐标旋转)两个步骤
也叫坐标平移)和转轴(也叫坐标旋转)两个步骤
http://jpkc.xxu.edu.cn/xiaonei09/%E8%A7%A3%E6%9E%90%E5%87%A0%E4%BD%95/%E8%A7%A3%E6%9E%90%E5%87%A0%E4%BD%95%E7%B2%BE%E5%93%81%E8%AF%BE%E7%A8%8B%E7%94%B3%E6%8A%A5%E6%9D%90%E6%96%99/%E8%A7%A3%E6%9E%90%E5%87%A0%E4%BD%95%E7%BD%91%E7%AB%99/Skin/secondpage/Skin2/zcr-56.htm
角动量为0的波函数是一个中心对称的圆球,在任何方向没有极化。
[PPT]二次曲线的直径 - 浙江师范大学网络课程
course.zjnu.cn/hnc/jieji/二次曲线一般理论.ppt
轉為繁體網頁
轉為繁體網頁
平移坐標軸
mail.smhs.kh.edu.tw/~tch044/planvaried/sub-1-3.htm
[PPT]空间解析几何(第5章).
eol.aku.edu.cn/eol/common/fckeditor/openfile.jsp?id...
轉為繁體網頁
轉為繁體網頁
| |||||||||||||||||||||||||||||||||||||||||
是不是想问为什么角动量的转轴是对称轴才成立?
我想是因为L=Iω中,转动惯量I需必须满足平行轴定理
这是维基百科中给的图例,其中正在转动的圆球是一个质点,当质点转动时,我们在计算转动惯量I时不需要计算转轴的位置
但是,当转动物体是一个多质点组成的系统时(比如一个圆盘或者圆柱),转动惯量,我们就要用积分计算转动惯量,为了便于计算,在计算常用的转动惯量时,可以参照转动惯量列表
也就是说,如果定义中不规定转轴不是对称轴的话,我们就无法计算积分
[0] | 我想是因为L=Iω中,转动惯量I需必须满足平行轴定理
这是维基百科中给的图例,其中正在转动的圆球是一个质点,当质点转动时,我们在计算转动惯量I时不需要计算转轴的位置
但是,当转动物体是一个多质点组成的系统时(比如一个圆盘或者圆柱),转动惯量,我们就要用积分计算转动惯量,为了便于计算,在计算常用的转动惯量时,可以参照转动惯量列表
也就是说,如果定义中不规定转轴不是对称轴的话,我们就无法计算积分
2013-03-19 16:58 Mannose 只看Ta
是说当转动轴不是对称轴的时候,用积分就没办法算转动惯量了吗?
[0] |
引用@杨氏的量 的话:是不是想问为什么角动量的转轴是对称轴才成立?我想是因为L=Iω中,转动惯量I需必须满足平行轴定理这是维基百科中给的图例,其中正在转动的圆球是一个质点,当质点转动时,我们在计算转动惯量I时不需要计算转轴的位置但是,当转动物体是一个多质点组成的系统时(比如一个圆盘或者圆柱),转动惯量,我们就要用积分计算转动惯量,为了便于计算,在计算常用的转动惯量时,可以参照也就是说,如果定义中不规定转轴不是对称轴的话,我们就无法计算积分
是说当转动轴不是对称轴的时候,用积分就没办法算转动惯量了吗?
2013-03-22 11:46 蜡笔桶装鬼小戏 物理专业 只看Ta
1,角动量为0的波函数是一个中心对称的圆球,在任何方向没有极化。
一般情况下的L=Iω是个矢量方程,其中的I是一个二阶张量……
在转轴为对称轴的情况下可以退化为对应的标量方程,否则会有一些烦死人的交叉项……
在转轴为对称轴的情况下可以退化为对应的标量方程,否则会有一些烦死人的交叉项……
SOME PHYSICS
小站 注册 登录
主说:让原子跃迁
于是
原子见到光,便会了跃迁
原子中每个电子原本都存在于各自稳定的能级之中,因此原子自身是稳定的。假使有一束光子袭来,实验告诉我们,电子能够一份一份地吸收这些光子,且自身从低能级跃迁到高能级上去。与此同时,激光告诉我们,电子也能被这个光子诱导,从一个高能级衰变到低能级下来;此外,led灯也告诉我们,即便没有外加光子的骚扰,因为真空震荡,这些真空中的虚光子也可以诱导电子衰变,形成自发辐射。电子和光子的相互作用,不可谓不丰富,不可谓不独特,不可谓不神奇。
然而电子-光子相互作用的跃迁是要满足一定条件的。从能量上看,能量要守恒:Ei=Ef+gamma。其中Ef是终态电子在原子核中的能量,Ei是初态的能量,gamma是光子的能量。除此之外,角动量也要守恒:电子的初态绕着原子核转,有这么一个角动量a,终态上,电子以另外一种形态绕着原子核转,有这么一个角动量b。这两个角动量的差必须由光子来补充,这就是角动量守恒的限制。
不过一个以概率云存在的电子,是通过何种机制辐射和吸收光子的呢?那么电子波函数的跃迁和一个经典的辐射模型有没有什么联系?从经典的电磁理论中我们且知,一个变速运动的电子能发出光子;一个简谐震荡的偶极子也能够发射光子(偶极子辐射)。这两者之间是否存在着联系?本文希望能在有限的篇幅内理其深意,予以解答。
1. 稳态的波函数:
作为准备,我们以氢原子为例,将电子在稳态下各个能级的波函数绘出如下:
其中L代表不同的角动量,ml代表不同的角动量分量,主量子数n决定波函数的能量但不影响其角度分布。我们只主要注意L<n即可,因此这里略去。不难发现一下几点:
1,角动量为0的波函数是一个中心对称的圆球,在任何方向没有极化。
2,角动量不为0的波函数,在空间存在极化。这里选择z为我们的极化轴,那么ml就代表波函数在z轴上的角动量分量。不难看出,当ml=1,2,3时,波函数呈以z轴为中心的扁平状,这其实可以看作是电子的相位沿着扁平状的轨道绕着z 轴旋转。ml取的正,负号无非是电子旋转的方向顺/逆时针不同罢了。当ml=0时候,电子的相位轨迹可以看作是沿着z轴在z正负半轴震荡,因此其运动在z轴上的投影为0。
3,注意,电子相位的轨迹并不是电子运动的轨迹。电子的相位速度不是0,但群速度为0,因为稳态的电子波函数是驻波。波函数的模中已经没有了相位信息,因此电子在上述能级中是依照空间中的概率密度稳定存在的。这时候的电子因为静止,自然无法辐射光子。
2. 波函数的相干:
由上可知,虽然波的相位运动能决定角动量,但波的相位不会决定电子存在的概率分布。这是不是说波的相位从物理观测的角度上说,就毫无意义了呢?
如果能够回想起光的干涉试验,我们就会明白,在干涉中,波的相位将会呈现出明确的物理意义:它能通过相消和相长干涉重新定义波的概率分布。
把电子看作波,本质上说也就等价于允许电子进行干涉。那么电子究竟是否会发生干涉么?如果是,在什么条件下发生,干涉的结果又是如何呢?
3. 电子的干涉:
如果没有外界扰动,电子将永远地在自己地能级上呆下去,他们的确并不会干涉。然而在外加电磁波存在的情况下,局面就发生了改变。
由微扰理论我们可知,系统在存在扰动情况下的本征态,将不可避免地成为无微扰时本征态的线性组合,也就是相干态。假定原子有2个能态|1>和|2>。那么微扰后,系统新的本征态将会变成[1]:
|1>'=a|1>+b|2>, ....
这里的a和b是一个和扰动大小以及形式有关的系数。和电磁波中光的干涉一样,此处的线性组合,就代表了电子波函数之间的干涉:因为如果我们算新状态|1>'的强度(概率密度),也就是他的模,那么在表达式中将不可避免地出现|1>和|2>的交叉项,他们互相之间的相位就会开始起作用。
从薛定锷时间演化方程我们知道,电子波函数含时分量的相位正比于其能量:
也就是说,交叉项本身非但不为0,而且还含有一个和两个能级能量差相等的振荡频率。实际上我们下面就会说明,这么一个振荡频率,就是干涉后,电子概率波运动的频率,这也就决定了电子偶极子振荡后,发出/吸收光子的频率。转化成我们熟悉的语言,这就是著名的:
跃迁能量守恒关系。
为方便比较,我们将各稳态波函数相位随时间演化的函数作图如下。由图明确可以看出,磁量子数ml大小及其符号和角动量z轴分量大小,方向等的对应关系:
3.1 L=0, ml=0:
3.2 L=1,ml=0:
3.3 L=1, ml=1:
3.4 L=1,ml=-1:
3.5 L=2, ml=0:
3.6 L=2, ml=1:
3.7 L=2, ml=2:
3.8 L=3, ml=0:
3.9 L=3, ml=1:
3.10 L=3, ml=2:
3.11 L=3, ml=3:
4. 干涉,偶极子允许跃迁和跃迁禁闭:
由上可知,微扰导致干涉,而最后一节我们会看到,干涉就是引起跃迁根本原因。根据已知的本征态波函数和上面的含时相位关系,我们依次计算出不同能级干涉状态下的演化波函数。为了方便观察,我们将其做成了动画的形式(下图作者版权所有),依次列举如下:
4.1 态 l=0 和 l=1, ml=0 的干涉:
不难发现,这描述的是一个概率波沿着z轴振荡的电子。其振荡频率就等于两个能级之差(除以hbar)。考虑到电子带负电,原子核带正电,原子核不动,因此这就是一个振荡的偶极子。显然,该偶极子能够释放或者吸收一个线偏振光子。这就形象描述了一个从l=0到l=1,delta l=1这么一个跃迁过程中,电子波函数的演化过程。
4.2 态 l=0 和 l=1, ml=1 的干涉:
这是一个概率波绕着着z轴旋转振荡的电子。同时它就构成了一个旋转振荡的偶极子。显然,该偶极子能够释放或者吸收一个逆时针的圆偏振光子。这就形象描述了一个delta l=1 同时 delta ml=1 这么一个跃迁过程中,电子波函数的演化过程。
4.2 态 l=0 和 l=1, ml=-1 的干涉:
这是一个概率波绕着着z轴旋转振荡的电子。同时它就构成了一个旋转振荡的偶极子。显然,该偶极子能够释放或者吸收一个顺时针的圆偏振光子。这就形象描述了一个delta l=1 同时 delta ml=-1 这么一个跃迁过程中,电子波函数的演化过程。
以上3种情态对应了经典电磁场中振荡的电偶极子,因此能释放/吸收光子。这种跃迁叫做电偶极子允许跃迁
4.3 态 l=0 和 l=2, ml=0 的干涉:
我们下面来看一看一个电子如果要从l=0跃迁到l=2 上去,将会出现什么样子的情态:
你能看到,此刻,电子云虽然也在振荡,可由于其关于z轴原点处对称,在正半轴的电子云和负半轴的电子云恰好抵消,因此无法产生一个非零的偶极子,这样的跃迁不能辐射和吸收光子。这因此也叫做电偶极子跃迁禁闭。也就是说,如果你对氢原子照射一个光子,在电偶极子理论下,它是无论如何也不会发生从l=0到l=2的跃迁的。
出于好奇,我们再看一看ml=1和2情况下,l从0到2的“跃迁”情态:
(ml=1)
(ml=2)
这些ml非零的跃迁虽然存在围绕z轴的角动量,但因为电子云始终关于原点对称,无法形成有效的极化(你可以看成2个头尾相反的偶极子的叠加,他们的有效偶极子就是0),因此无法进行偶极子辐射。他们因此也是电偶极子跃迁禁闭的。
4.4 态 l=0 和 l=3, ml=0 的干涉:
出于好奇,我们再看看从0到3的干涉图样:
能够证明,此时的波函数仍旧是关于z轴对称的(虽然形状不同,但积分之后,总电荷量是对称的)。因此同理,也无法进行电偶极子辐射。
4.5 其他几种从l=1到l=2态的干涉:
从上到下依次是ml=0,1,2。如果取ml=-1,-2,那么旋转方向变成顺时针。这些情态下,不难发现当ml=0和1时,是存在偶极子跃迁的,ml=2时没有偶极子跃迁。
5. 偶极子跃迁选择定理
由上分析,我们不难得到著名的偶极子跃迁选择定理(selection rule):
这也就是偶极子跃迁能发生的条件。从上面的动画,我相信大家此刻都对这么一条抽象的定理有了更为形象和深刻的理解:因为只有满足这些条件的跃迁,才会干涉出有效的振荡偶极子。其一般性可以从偶极子的空间对称性中得到证明。
6. 多极子的跃迁[3]
上面4.3,4.4,和4.5(3)所述之情态是否就完全无法辐射光子了呢?答案是否定的。这些非偶极子的电荷分布完全可能发射出四极子,八极子甚至更高数目极子的辐射,详细的说明可以参考jackson的关于偶极展开这部分内容。只不过这些多极子的强度将大大小于偶极子(每一级约为1000倍)。在存在偶极子跃迁的系统中,我们观察到的吸收主要来自于偶极子。
例如关于四极子,我们也有对应的允许/禁闭条件:
这也就是说,类似4.3的情况,将会存在四偶极子振荡;类似4.4的情况,将会存在八偶极子。类似4.5(3)的情况,因为既不满足偶极子又不满足四极子或更高极子的条件,因此不会有任何辐射,也就不会和对应的光子发生任何耦合(4.5(3)的形状也的确够扭曲的)。
7. 跃迁
在电磁场对原子体系进行扰动的过程中,电子云的相关各态之间发生了干涉。在做图的时候,我们假定了a,b系数恒定。这是不符合事实全貌的,但却是合理的,因为外加扰动的振荡频率应该远小于电子波函数本身的演化频率(或者说,电磁波的能量小于电子所在能态的能量)。因此,上文给出的演化情态在扰动过程中来看,是符合事实的。
但干涉的电磁波本身毕竟是时间的函数,严格地说,我们应该使用含时微扰。因为篇幅限制,我们不可能继续展开,但有一点可以肯定的是,此刻系数a,b也会是时间的函数。在吸收开始前,a=1,b=0,系统完全处于初态;在吸收结束后b=1,a=0,系统终结于末态。因此电子的波函数不会是永远振荡的,而是始于作用开始,结于作用完成。在这一过程中,电子将完成数十到数百次如上述的振荡,释放出一个频率满足E1-E2关系的光子波包。这个波包的长度可以从这一振荡总的持续时间来估算;这一时间总的来说满足时间-能量的测不准定理。
从上述偶极子振荡发出的功率,我们还能算出每秒钟,电子振荡所释放/吸收的光子数。由此我们能得到吸收/辐射的概率,并推算跃迁通道的life time。这些结论都和爱因斯坦的公式完全吻合[2]。
最后,我们以l=0 到 l=1且ml=0为例,考虑一个a,b含时变化下,电子云真实的振荡情况。由此我们能形象的看出一个电子是如何从初始状态,通过干涉,最终振荡跃迁到终止状态中去的:
全文完
[1]:量子力学的不含时微扰论
[2]:具体的计算细节可参考:Introduction to Modern Optics, Grant R Fowles.
[3]:注意到多极子跃迁中,角动量变化可能大于光子的自旋角动量,Lphoton=1,这一部分多余的角动量将由光子的轨道角动量提供。
Bo Zeng
(c)2013
分享87 评论25 喜欢12
No comments:
Post a Comment