摘要:直积有时候称为“完全直积”,以区别于“离散直积”(就是直和)。物理中经常用到的张量积也是这样定义的。3)(拓扑空间上)向量丛的张量积。张量积与直积的区别是明显的。至少数学中的张量积与直积基本上(不完全)是泾渭分明的。数学上基本上按照这些定义来区分张量积和直积。
前言:此文修正了过去主帖的武断观点,并且将若干回帖合并,然后扩充成文。说数学定义与
物理 定义的异同,不是指数学上和物理上的定义之间有区别,而是数学家内部都有争议,物
理学 家内部也有类似争议。
直积的思想背景来自Descartes,因此被称为Descartes积(Cartesian product)。直积有时候称为“完全直积”,以区别于“离散直积”(就是直和)。因此有限个因子的直积就是离散积,因此也就是直和。直和只有在非 Abel范畴情形下才被称为“离散直积”。每个向量空间可以分解为一维子空间的直和。
张量积的定义有很多:
1)含单位元的结合交换环A上的两个幺模的张量积。若V_i,V_j是自由A模,e_i,e_j分别是V_i,V_j的基,那么(e_iⅹ e_j)就是V_1与V_2的直积的基。如果V_i,V_j都是有限生成自由模,那么dim(V_iⅹV_j)= dimV_iXdimV_j。数域K上有限维向量空间就是有限生成模,所以就适用于这种情形。物理中经常用到的张量积也是这样定义的。我们可以把两个张量积的概念推广到多个甚至无限个的情形。
2)与上面定义相关的还有两个
矩阵 A与B的张量积,也称为Kronecker积。如果A的矩阵元为a_ij,B的矩阵元为b_mn,那么A与B的张量积的元素就是a_ij与b_mn分别相乘,形成的矩阵的行数就是im,列数就是jn。如果我们把矩阵A看为ij维空间,把矩阵B看成mn维空间,那么矩阵A与B的张量积就是ijmn维空间,与第一种定义是对应的。
3)(拓扑空间上)向量丛的张量积。各个向量丛的转移函数的矩阵张量积(Kronecker积)就是向量丛张量积的转移函数。
4)含幺结合单位环上的代数的张量积,这个与物理学的关系不算很大,因此不是我们关心的,暂时不谈论。
5)群表示的张量积。与拓扑群表示论密切相关,虽然拓扑群表示论与量子场论的关系很密切,但是这个不是这篇文章的主题,所以也不是我们现在要讨论的。
我们从上面的定义中可以看出,虽然张量积种类多种,但是前三种张量积基本上可以视为同一本质,都与直积严格区分。张量积与直积的区别是明显的。至少数学中的张量积与直积基本上(不完全)是泾渭分明的。
数学上基本上按照这些定义来区分张量积和直积。但是一些物理
教科书 和一些物理文献将直和与直积这两个“基本”上相同的概念作为两个完全不同的概念,前者对应了数学上的直和即离散直积,后者对应了数学上的张量积。马中骐教授的《物理学中的群论》的第一章的最后一节和喀兴林教授的《高等量子力学》的第一章最后一节,在讨论了矢量空间的直和与
标题: 笛卡儿积,直和和张量积,以及对直积的争议
作者:
blackhole
〇、缘起
2007年的某天,我在繁星客栈上看到直积和直和在有限维是一回事的评论,我立刻陷入巨大的疑惑和震惊之中。这种疑惑象一块巨石,压得我透不过气来。为了解惑,我必须使出浑身解数来换得内心的安宁。
一、追本溯源
集合的笛卡儿积(也称为集合的直积),简单的说,就是从两个集合中各拿出一个元素,构成有序组。所有这样的有序组就组成两个集合的笛卡儿积。集合A和B的笛卡儿积表示为A×B,它也是一个集合。其中的元素表示为(a,b),其中a∈A, b∈B。之所以使用“积”这个字,一个简单的理由是,如果两个集合都是有限集,那么其笛卡儿积的元素数目是两集合元素数目之积。
现在有两个有限维线性空间V,W,其数域同为F。(若不相同,则需一个是另一个的子集,此时取此子集为F。)考虑二者的笛卡儿积V×W。它现在还只能是个集合,其中尚未引入代数结构。这可以有两种方案。
方案一:
定义V×W中任意两元素的和为
(v1,w1)+(v2,w2)=(v1+v2,w1+w2)。 (1)
定义F中的元素λ与V×W中元素的数乘为
λ(v,w)=( λv, λw)。 (2)
这样,集合V×W就构成了域F上的线性空间。此即线性空间V和W的直和,记为V○+W。忽略V○+W中的代数结构,可以认为V×W=V○+W,即二者的元素完全一样。
设V中的基矢为ev_i(i=1,...,n),W中的基矢为ew_i(i=1,...,m),则线性空间V○+W中元素的一般表达式为(Σx_i ev_i, Σy_i ew_i)。其独立变量x_i, y_i的个数为n+m(每个都从域F中取值),故此直和空间的维数维n+m。
方案二:
首先将集合V×W中的部分元素等同起来:
(λv, w)= (v, λw)。 (3)
然后对部分元素定义二元运算——和:
(v1,w)+(v2,w)=(v1+v2,w), (4)
(v,w1)+(v,w2)=(v,w1+w2)。 (5)
又定义数乘:
λ(v,w)=( λv, w) =( v, λw)。 (6)
显然,对于V×W中两元素,(v1,w1)+(v2,w2)当且仅当v1, v2线性相关或w1,w2线性相关时才∈V×W。如果不是这样,则它们的和是没有定义的;或者可以认定它们的和有意义,只是(v1,w1)+(v2, w2)\∈V×W(\∈表示“不属于”)。由于我们需要的是线性空间,故此时显然需将集合V×W的范围扩大以包含这种新的元素。
具体的操作如下:(感谢青松的精炼总结)
1. 让V×W中的元素进行各种有限线性组合(加法和数乘),命L(V×W)为所有这种组合构成的集合。它显然构成线性空间。可以认为V×W是L(V×W)的生成元。
2. 在L(V×W)中利用关系(4)-(6)对各元素进行归并(等同),去掉冗余矢量。
3. L(V×W)在进行这种化简后仍然构成线性空间,此即空间V,W的张量积,记为V○×W。
此张量积空间中的任意矢量皆可表示为Σa_(ij) (ev_i,ew_j),有nm个独立变量,故此空间的维数为mn。
从较高级的语言来说,这里所谓的归并就是在L(V×W)中建立等价关系,其得到的陪集的集合构成线性空间,称为商空间。它就是V○×W。
几点说明。先令V×W/U表示V×W在元素归并后的集合(本质上这是商的表示,此处不谈,仅用其符号)。
1、V○×W中的元素分为两类:处于集合V×W/U中的和处于V×W/U外的。前者对应于非纠缠态(或矢量分析中的并矢),后者对应于纠缠态。
2、在任何维数情况下,V×W/U< V×W,即笛卡儿积中总会有冗余。
3、在大多数情况(m,n>1)下,V○×W> V×W/U,即在张量积中有“纠缠态”。
4、在大多数情况(mn>m+n)下,dim(V○×W)>dim( V○+W)。此结论几乎就是同义反复。此外的情况是1*n<1+n和2*2=2+2。
对于维数中有一个为1(1*n<1+n)的情形,此两空间的笛卡儿积一定有冗余,例如 (2,(1,3))=(1,(2,6)) (设n=2)。此外,此集合中的所有元素进行任意有限线性组合时,所得到的元素在归并后都处于此集合之中。用物理的语言说,由于有一个空间是一维的,故不可能构成“纠缠态”。此时dim(V○×W)<dim( V○+W)。
对于维数2*2=2+2的特例,可以这样形象解释。首先笛卡儿积中的冗余会减少一些元素。而此集合中的所有元素进行加法和数乘时,又会得到非此集合之中的元素(纠缠态)。一减一增,刚好达到平衡:dim(V○×W)=dim( V○+W)。
下面就两个两维空间取张量积的过程举几个例子。
因冗余而减少的元素有:((4,8),(1,5))= ((2,4),(2,10))= ((1,2),(4,20))= ((4/3,8/3),(3,15))= …
因得到“纠缠态”而增加的元素有:((1,2),(3,4))+ ((1.2,2),(3.1,4))。
此外值得一提的是四个“Bell基”:((1,0),(1,0))± ((0,1), (0,1)),((1,0),(0, 1))± ((0,1), (1,0))。
作为对有序对的强调,对于直和而言的一个例子是,平面上(1,2)和(2,1)不是同一个点。对于张量积的一个例子是,e_x e_y≠e_y e_x.
又:如果是两个线性空间还是内积空间,那么要想是其直和和张量积也成为内积空间,需在第一种和第二种方案中分别添加对内积的定义:
(v1,w1)•(v2,w2)= v1•v2+ w1•w2 (7)
(v1,w1)•(v2,w2)= (v1•v2)(w1•w2)。 (8)
当然此时的内积都从域F中取值。
总之,线性空间的直和和张量积都来自于集合的笛卡儿积这个原始概念。而它们之间的区别,首先在于对此笛卡儿积赋予不同的代数结构。对直和而言,在忽略代数结构的前提下可认为直和=笛卡儿积;而且对张量积而言,一方面它比笛卡儿积大(多数情况),另一方面笛卡儿积中的元素有冗余。
二、争论的根源和现状
以上意见应该是大家都能接受的,其中刻意回避了“直积”一词。就直积而引起的争论,在本质上不是来自于客观的学理,而是来自于主观的习惯或定义。这一方面简化了问题:不用争论太多了;另一方面又使问题复杂化:既然不是客观学理,就不会有唯一结论。
争论的现状是存在两种相反的观点:
A.直积=直和,为数学家所偏好;
B.直积=张量积,为物理学家所偏好。
观点A的理由是:
根据前面的分析,在忽略代数结构的前提下可认为直和=笛卡儿积,而集合的笛卡儿积又称为直积,故线性空间的直和=直积。这符合通常的学术称谓原则,比较“庙堂”。(真的非常符合吗?见下。)
还有一点需说明。虽然数学家和物理学家都同意把第一种方案的结果称为直“和”,但他们其实是出于不同的原因。弄清楚各自的原因,也许有助于双方理解对方。
对数学家而言,本没有“和”,只有所谓的二元运算(或操作):一集合中两元素经过二元运算后还是此集合中的元素。那么总要给它一个名称。用什么名字呢?现成的有“和”跟“积”。这里数学家偷了个懒,直接采用“积”或“乘法”来命名一般的二元运算。(其实个人感觉,如果发明一个新的词来指称一般二元运算,可能以后的名称系统要清晰些。)有一种特殊的“积”,它跟两元素的顺序无关,即Abel情况,而两个数的通常的和也跟顺序无关,于是就这么牵强地把这种特殊的“积”叫做“和”。(其实通常的积也跟顺序无关啊。Hehe。)而线性空间正是这种情况,所以其中的二元运算又称为“和”(原本作为一般二元运算而言应该叫“积”的)。于是,本来两线性空间的笛卡儿积加上第一种代数结构方案后该称为“直积”(这个“积”字的使用不是来自于指称二元运算,而是来自于指称集合关系的笛卡儿积的“积”)的,但由于是Abel情况,故又称为“直和”。(线性空间是一种特殊的模,而模必须是Abel的,所以直和可以一般地对模有定义。)
物理学家的想法就简单多了:基矢不就是两空间的基矢放在一块吗?维数不就两维数之和吗? 这不就是“直接加”起来吗?所以就叫“直和”了。
观点B的理由是:
1、让直和、直积(=张量积)并举在形式上很完美,很对称,如各自的维数分别为m+n和mn,体现了“和”跟“积”。
2、就张量积在物理(如量子力学)中的应用来说,称为直积在语义上非常自然:两无关粒子体系的波函数或有几个无关自由度的粒子的波函数不就是把各自的波函数“直接乘”起来吗?
3、对于矩阵,大家都同意直积=张量积=kronecker积吧?这自然而然会诱导出,对于矢量和容纳矢量的线性空间都有直积=张量积=kronecker积。
这种理由也很强,但比较“江湖”。本人天生就是B派中人,所以可以理解我刚看到另一个派观点时的震惊。
而且从前面的学理分析中还可以得到弱化A派观点的天然性的理由:直和和张量积不都是笛卡儿积(直积)的儿子吗?都是试图加上某种代数结构而已。一个是一加就加上了,得到直和;一个是一加才发现比较麻烦,七弄八弄弄出了张量积。直和长得漂亮,而张量积长得丑陋,皇上的别名就只能继承给直和啊。(这里当“泛性”之类的东东不存在。)
总之,双方理由都很充分。为尽量维持和平,我建议B派对于A派言论“R与R^2的直积是R^3”可以采用进一步解释的方式来减少对抗情绪:先把“直积”区分为集合意义下的直积(≡笛卡儿积≈直和)和线性空间意义下的直积(=张量积),然后视此言论为“R与R^2取集合意义下的直积时得到R^3”而同意之。
前面说了,现在的争论不是学理上的,所以只有靠实力来解决了。下面例举分别支持两位太子的势力。
1、数学著作持观点A:
太多了,只简单列出两个网页:
http://en.wikipedia.org/wiki/Direct_product#Direct_product_of_modules
http://mathworld.wolfram.com/DirectProduct.html
(注:该页中有一句:the direct product of two vector spaces of dimensions m and n is a vector space of dimension mn. 此处mn应为m+n之误。刚看到时可把我乐坏了。)
2、物理著作持观点B:
太多了,只列几个:
Principles of Quantum Mechanics, R. Shankar
Quantum Theory: Concepts and Methods, Asher Peres
高等量子力学,喀兴林
引人注目的是双方的叛徒,因为这属于少数。
3、数学著作持(或相当于持)观点B:
a、Concise Encyclopedia of Mathematics CD-ROM中,其Tensor Product词条就直接指向Direct Product (Tensor)词条(此条的内容主要涉及广义相对论中的张量)。
b、Lectures on Matrices, J. H. M. Wedderburn, 1934, p. 151, 里面谈到了两个结合代数的直和和直积,其各自的定义直接对应于前面的方案一和二。
c、《抽象代数学》卷2(线性代数部分)(中译本),第七章,向量空间的积。其线条是:直积→Kronecker积→张量空间。
d、《环与代数》(著者不祥)p. 22,在谈论两个代数的内张量积时,括号内注明:或直积,或Kronecker积。
(后三者已打包发至stars_forum1@yahoo.com,信名为direct product.rar by blackhole。)
4、物理著作持(或相当于持)观点A:
(暂缺。)
这就是两个太子争夺皇上别名继承权的故事。作为B派中人,我很高兴地发现A派有叛徒,而本派没有发现。
三、本文的写作目的兼摘要
1、追究两个太子跟皇上到底有多密切的关系。
2、告诉B派A派意见的合理性:直和是长得最帅的,而且A派是直通皇上的。
3、告诉A派B派意见的合理性:张量积也有继承权,且继承之后事情在表面上会变得很简单。
(本文的基金支持为母亲做的饭。)
参考文献:
A派的总纲领见本站
http://www.changhai.org/forum/collection_article_load.php?aid=1166728646
下面是A派的聚会:
http://www.changhai.org/forum/article_load.php?fid=5&aid=1166719955
http://www.changhai.org/forum/article_load.php?fid=5&aid=1165561971
本派的发言此前很少,就在第三帖中找吧。
本次双方的大讨论见
http://www.changhai.org/forum/article_load.php?fid=5&aid=1185529999
http://www.changhai.org/forum/article_load.php?fid=5&aid=1185551167
http://www.changhai.org/forum/article_load.php?fid=5&aid=1185619476
卷积的本质及物理意义
分三个部分来理解: 1. 信号的角度
2. 数学家的理解(外行) 3. 与多项式的关系
卷积这个东东是“信号与系统”中论述系统对输入信号的响应而提出的。因为是对模拟信号论述的,所以常常带有繁琐的算术推倒,很简单的问题的本质常常就被一大堆公式淹没了,那么卷积究竟物理意义怎么样呢? 卷积表示为y(n) = x(n)*h(n)
使用离散数列来理解卷积会更形象一点,我们把y(n)的序列表示成y(0),y(1),y(2) and so on; 这是系统响应出来的信号。
同理,x(n)的对应时刻的序列为x(0),x(1),x(2)...and so on;
其实我们如果没有学过信号与系统,就常识来讲,系统的响应不仅与当前时刻系统的输入有关,也跟之前若干时刻的输入有关,因为我们可以理解为这是之前时刻的输入信号经过一种过程(这种过程可以是递减,削弱,或其他)对现在时刻系统输出的影响,那么显然,我们计算系统输出时就必须考虑现在时刻的信号输入的响应以及之前若干时刻信号输入的响应之“残留”影响的一个叠加效果。
假设0时刻系统的响应为y(0),若其在1时刻时,此种响应未改变,则1时刻的响应就变成了y(0)+y(1),叫序列的累加和(与序列的和不一样)。但常常系统中不是这样的,因为0时刻的响应不太可能在1时刻仍旧未变化,那么怎么表述这种变化呢,就通过h(t)这个响应函数与x(0)相乘来表述,表述为x(m)×h(n-m),具体表达式不用多管,只要记着有大概这种关系,引入这个函数就能够表述y(0)在1时刻究竟削弱了多少,然后削弱后的值才是y(0)在1时刻的真实值,再通过累加和运算,才得到真实的系统响应。
再拓展点,某时刻的系统响应往往不一定是由当前时刻和前一时刻这两个响应决定的,也可能是再加上前前时刻,前前前时刻,前前前前时刻,等等,那么怎么约束这个范围呢,就是通过对h(n)这个函数在表达式中变化后的h(n-m)中的m的范围来约束的。即说白了,就是当前时刻的系统响应与多少个之前时刻的响应的“残留影响”有关。
当考虑这些因素后,就可以描述成一个系统响应了,而这些因素通过一个表达式(卷积)即描述出来不得不说是数学的巧妙和迷人之处了。
http://blog.chinaunix.net/u2/76475/showart_1682636.html ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
卷积是人为定义的一种运算,就是为了计算的方便规定的一种算法。两个函数普通乘积的积分变换(傅里叶变换与拉普拉斯变换)与这两个函数积分变换的卷积建立了关系,使我们只要会求两个函数的变换,利用卷积就可以求这两个函数乘积的变换。 卷积在数据处理中用来平滑,卷积有平滑效应和展宽效应.
谈起卷积分当然要先说说冲击函数----这个倒立的小蝌蚪,卷积其实就是为它诞生的。“冲击函数”是狄拉克为了解决一些瞬间作用的物理现象而提出的符号。古人曰:“说一堆大道理不如举一个好例子”,冲量这一物理现象很能说明“冲击函数”。在t时间内对一物体作用F的力,我们可以让作用时间t很小,作用力F很大,但让Ft的乘积不变,即冲量不变。于是在用t做横坐标、F做纵坐标的坐标系中,就如同一个面积不变的长方形,底边被挤的窄窄的,高度被挤的高高的,在数学中它可以被挤到无限高,但即使它无限瘦、无限高、但它仍然保持面积不变(它没有被挤没!),为了证实它的存在,可以对它进行积分,积分就是求面积嘛!于是“卷积”这个数学怪物就这样诞生了。说它是数学怪物是因为追求完美的数学
县令铺开坐标纸,以打板子的个数作为X轴,以哼哼的程度(输出)为Y轴,绘制了一条曲线:
——呜呼呀!这曲线象一座高山,弄不懂弄不懂。为啥那个无赖连挨了三十天大板却不喊绕命呀?
—— 呵呵,你打一次的时间间隔(Δτ=24小时)太长了,所以那个无赖承受的痛苦程度一天一利索,没有叠加,始终是一个常数;如果缩短打板子的时间间隔(建议 Δτ=0.5秒),那他的痛苦程度可就迅速叠加了;等到这无赖挨三十个大板(t=30)时,痛苦程度达到了他能喊叫的极限,会收到最好的惩戒效果,再多打就显示不出您的仁慈了。 ——还是不太明白,时间间隔小,为什么痛苦程度会叠加呢?
——这与人(线性时不变系统)对板子(脉冲、输入、激 励)的响应有关。什么是响应?人挨一个板子后,疼痛的感觉会在一天(假设的,因人而异)内慢慢消失(衰减),而不可能突然消失。这样一来,只要打板子的时间间隔很小,每一个板子引起的疼痛都来不及完全衰减,都会对最终的痛苦程度有不同的贡献:
t个大板子造成的痛苦程度=Σ(第τ个大板子引起的痛苦*衰减系数) [衰减系数是(t-τ)的函数,仔细品味] 数学表达为:y(t)=∫T(τ)H(t-τ)
——拿人的痛苦来说卷积的事,太残忍了。除了人以外,其他事物也符合这条规律吗? ——呵呵,县令大人毕竟仁慈。其实除人之外,很多事情也遵循此道。好好想一想,铁丝为什么弯曲一次不折,快速弯曲多次却会轻易折掉呢?
——恩,一时还弄不清,容本官慢慢想来——但有一点是明确地——来人啊,将撒尿的那个无赖抓来,狠打40大板! 也可以这样理解:
T(τ)即第τ个板子,H(t-τ)就是第τ个板子引起的痛苦到t时刻的痛苦程度,所有板子加起来就是∫T(τ)H(t-τ)
http://hi.baidu.com/a__g/blog/item/10873722cab331ac4723e8f7.html ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
卷积法的原理是根据线性定常电路的性质(齐次性、叠加性、时不变性、积分性等),借助电路的单位冲激响应h(t),求解系统响应的工具,
系统的激励一般都可以表示为冲击函数和激励的函数的卷积,而卷积为高等数学中的积分概念。建议你去看看定积分的内容。特别注意的是:概念中冲击函数的幅度是由每个矩形微元的面积决定的。
总的说来卷积就是用冲击函数表示激励函数,然后根据冲击响应求解系统的零状态响应。
卷积实质上是对信号进行滤波。
卷积应该就是求和也就是积分,对于线性时不变的系统,输入可以分解成很多强度不同的冲激的和的形式(对于时域就是积分了),那么输出也就是这些冲激分别作用到系统产生的响应的和(或者积分)。所以卷积的物理意义就是表达了时域中输入,系统冲激响应,以及输出之间的关系。
卷积是在时域求解LTI系统对任意激励的零状态响应的好方法,可以避免直接求解复杂的微分方程。
从数学上来说卷积就是定义两个函数的一种乘法。对离散序列来说就是两个多项式的乘法。物理意义就是冲激响应的线性叠加,所谓冲激响应可以看作是一个函数,另一个函数按冲激信号正交展开。
在现实中,卷积代表的是将一种信号搬移到另一频率中.比如调制. 这是频率卷
No comments:
Post a Comment