Wednesday, August 8, 2012

一般的辛流形并不一定能实现为某个位形空间的余切丛

一般的辛流形并不一定能实现为某个位形空间的余切丛


小站会根据您的关注,为您发现更多,
看到喜欢的小站就马上关注吧!
下一站,你会遇见谁的梦想?

小站头像

终极理论之梦

RSS归档149人关注
2012/.04/.20

拓扑学简介(摘自科学松鼠会 原作者季候风)

http://songshuhui.net/archives/1633
(一)
拓扑学是现代数学的一个重要分支,同时是渗透到整个现代数学的思想方法。“拓扑”一词是音译自德文 topologie,最初由高斯的学生李斯亭引入 (1848年),用来表示一个新的研究方向,“位置的几何”。中国第一个拓扑学家是江泽涵,他早年在哈佛大学师从数学大师莫尔斯,学成后为中国带来了这个新学科(1931年)。
拓扑学经常被描述成 “橡皮泥的几何”,就是说它研究物体在连续变形下不变的性质。比如,所有多边形和圆周在拓扑意义下是一样的,因为多边形可以通过连续变形变成圆周,右边这个图上,一个茶杯可以连续地变为一个实心环,在拓扑学家眼里,它们是同一个对象。而圆周和线段在拓扑意义下就不一样,因为把圆周变成线段总会断裂(不连续)。为什么要研究这种性质呢?这就要追溯到几百年以前先贤们的遐想了。好在拓扑学比微积分还是新得多,用不着 “言必称希腊”,只要从莱布尼兹开始就行。


莱布尼兹作为微积分的主要奠基者之一,对抽象符号有特殊的偏好。经过他深思熟虑以后的微积分符号系统,比如微商符号 dy/dx,不久就把牛顿的符号系统比下去了。在1679年的时候,莱布尼兹突发奇想,尝试用抽象符号代表物体的几何性质,用以将几何性质代数化,通过符号的代数运算,由已有的几何性质产生新的几何性质。他不满意笛卡尔的坐标系方法,认为有些几何性质是跟几何体的大小无关的,从而不能直接在坐标系中予以体现。可能是由于这个想法太超前了,在他自己的脑子里也还只是混沌一片,而当年听到他这个想法的很多人,比如惠更斯,干脆就不予理睬。

莱布尼兹在三百多年前想要建立的,是现在称为“代数拓扑”的学问,中间经过欧拉,柯西,高斯,李斯亭,莫比乌斯,克莱因,特别是黎曼和贝迪的思考和尝试,终于在1920世纪之交,由法国天才数学家庞卡莱悟到了。在这些先驱中,高斯名气最大,被称为数学王子;大家可能不太熟悉黎曼,其实他同高斯在数学史上的地位是相当的,他在19世纪中叶的很多想法直到现在还有着巨大的影响;莫比乌斯,他在数学上有很多贡献,不过他为世人所知还多半是因为用他的名字命名的奇怪曲面:莫比乌斯带。左边这个图就是莫比乌斯带,它的重要特性是,虽然在每个局部都可以说正面反面,但整体上不能分隔成正面和反面。这种曲面叫做 “单侧曲面”。在这样的曲面上散步一定很别扭,哈哈。

(二)
这次来谈谈拓扑学中有代表性的一个课题, 扭结分类问题。所谓扭结,顾名思义就是一根绳子首尾相接,它可能打了结。更一般的,可以是几根绳子,除了自身打结以外,还互相打结。对具体的一个扭结,也许可以通过做实验的办法判断它是否打结,但是数学家希望找一个普适的,定量的办法。比如说,任意画一个扭结(它实际上是一个空间扭结的平面投影),比如这个有点复杂的,怎样不动手做实验就能判断它到底有没有打结?

这个问题后来证实是非常复杂的问题。在有了计算机以后,才能找到一种时间代价很高的算法让计算机帮助我们判断一个扭结投影到底有没有打结。直到 2006 年,才找到一种真正快速的计算机算法来判断这件事。
扭结分类的问题比判断是否打结更困难。比如,以下两个扭结都打了结,它们是否本质上是同一种结?

所谓 “分类”, 就是要找一个(可计算的)判据,使得当两个扭结满足这个判据时就是同一种结;当它们不满足这个判据时就不是同一种结。到现在为止,也还只能找到一些非常复杂的判据,同样要借助计算机才能大致判断两个扭结是否本质上为同一种结。
扭结理论有一段很有趣的早期历史。1867 年,著名物理学家开尔文勋爵,就是那个号称物理学已经接近终结,只剩 “两朵乌云”的开尔文,突然产生了关于化学元素表的新看法(那时候还没有发现原子,所以化学元素表还是一个谜)。开尔文认为,不同的化学元素其实是 “以太”的涡旋在空间中的扭结形态。“以太”是19 世纪的物理学家们发明的概念,它被想象成充满整个空间,是电磁波传播的载体(或媒质)。开尔文是很严肃的物理学家,当然不能凭空想象,实际上他提出了几个即使从现在的观点看来也很合理的证据:
1)元素很稳定,这可以用扭结的拓扑性质来解释,微小的形变不改变扭结的 “扭法”。
2)元素很多样,这可以用扭结的多样性来解释,不同的 “打结方式” 实在太多了。
3)不同的元素发出不同的光谱,这可以用 “以太扭结” 的各种 “振动方式” 来解释。
有时候我们不得不佩服一些大师,他们虽然偶尔有点信口开河,不过极富原创力想象力。开尔文这个想法可以算是 “弦论” 的原生态。虽然后来化学周期表更好地被理解为原子内部结构,但开尔文列举的这几个证据都能在新兴的弦论中依稀找到一点影子。
请原谅我不能在这里具体给出任何判断两个扭结不同的方法。任何这样一个方法,都需要很多图解和文字说明。有兴趣的网友可以读姜伯驹的《绳圈的数学》或者英文书 《An introduction to knot theory》, 作者 Lickorish, 属于系列 GTM (graduate texts in mathematics) 175. 再贴几个扭结:


然后是一个问题:下面三个扭结中,哪两个本质上是同一种结?


(三)
庞卡莱是 19 世纪末 20 世纪初法国最伟大的数学家,他与德国的希尔伯特领衔当时的数学界,分别继承了黎曼和高斯的衣钵:庞卡莱对物理世界的深刻洞察给了他天马行空般的想象力,一如当年的黎曼;希尔伯特严谨,博学,细致入微地思考,为 20 世纪前半叶数论和代数几何的发展指明了方向。庞卡莱的拓扑学和希尔伯特的代数几何,就像普朗克的量子论和爱因斯坦的相对论,完全革新了整个学科的基本观念。

这一帖就试试介绍庞卡莱引入的两个概念:“同调群” “基本群”。它们都是几何体内在性质的 “代数体现”。

庞卡莱意识到,描述一个几何体抽象性质的关键在于这个几何体本身有没有边界,以及它是不是其它几何体的边界。比如,一个圆盘和一个球面为什么不同,就是因为圆盘有边界而球面没有边界;球面为什么跟轮胎面不同,就是因为球面上的任何一个圈都是球面某一部分的边界,比如赤道就是北半球面的边界,而轮胎面上有的圈并不是轮胎面任何一部分的边界。

在第一篇里说过,莱布尼兹梦想用符号来表述一些抽象的几何性质。200多年后庞卡莱终于实现了这个梦,他把跟边界有关的性质数量化。先把几何体剖分成基本组成部分(点,边,三边形,四面体,...),比如,一个球面上可以画四个点,然后把它们两两相连 (不允许连线相交),有六条边,这些边把球面分成四个三边形,这就是球面的一个 “剖分”(见左图)。剖分的基本组成成份叫做单形 0 维单形, 1 维单形,(包括内部)是 2 维单形,等等 试想一下 3 维单形是什么

拿之前已经剖分的球面做例子,顶点 A, B, C, D 0 维单形,边 AB, AC, AD, BC, BD, CD 1 维单形,三边形 ABC, ABD, ACD, BCD 2 维单形 (如果 ABC, ACD 是东半球的区域,那 ABD, BCD 就包括了西半球) 。因为考察的是球面,而不是球体,所以没有三维以上的单形。

庞卡莱在单形前面放上系数(整数),假设它们能够相加,以及做同类项合并。这种表达式称为一个 比如

(3 AB – 2 BC) + (AC – 5 BC) = 3 AB – 7 BC + AC.

单形前面的加号减号具有几何意义,“定向”。在 1维的时候就是边的方向,比如,AB 是从 A B 的边,-AB 就是从 B A 的边,也就是 BA,所以 BA = - AB. 三边形的定向复杂一些,不过本质上就是跟顶点的排列顺序有关,对换两个顶点就会改变定向,
ACB = - ABC.

由于每一个 n 单形的边界由若干 n-1 单形组成,所以 求边界 可以作为一种运算,作用在 上,得到另一个,其每一项都比原来链里对应项的维数低一维在求边界的过程中,定向也是一个重要因素,虽然 AB 的边界是两个点 A B, 但为了体现定向性质,规定 AB 的边界是 ( B – A ). 这种约定可以推广到高维的链,大家不妨自己试试。

如果用 d记求边界运算,在跟定向相容的约定下,它在球面剖分的各单形上作用如下

d (A) = d (B) = d (C) =d (D) =0;

d (AB) = B-A, d (BA) = A-B, d (BC) = C-B, ……

d (ABC) = BC-AC+AB, d (BCD) = CD-BD+BC, ……

“链” 上的作用,

d (3 AB – 2 BC) = 3 d (AB) – 2 d (BC) = 3 (B-A) – 2 (C-B) = -3 A + 5 B - 2 C.

边界运算有一个很好的性质。直观上容易看到,“物体的边界没有边界”。比如,三边形的边界是三条边组成的闭合链。生活中我们说 “闭合” 的意思就是没有边界。代数上体现为,连续两次求边界一定是零

d [ d (BCD) ] = d [ CD – BD + BC ] = d(CD) – d(BD) + d(BC) = (D-C) – (D-B) + (C-B) = 0

现在把剖分后的几何体的所有这样的 放在一起,它们之间有加减法(合并同类项),可以用系数乘,还可以 求边界。这就得到了一个代数对象,叫做这个剖分后的几何体的链群”。这个代数对象跟我们开始的剖分方法有关。

在链群中,可以由求边界运算得到的链叫做 “边缘链”,比如,

2 AB + 2 BC + 2 CA = d ( 2 ABC )

说明等式左边这个链是一个边缘链。没有边界的链叫做 “闭链”。边缘链一定是闭链,而闭链不一定是边缘链庞卡莱发现,“有多少闭链不是边缘链” 这个性质与剖分无关,从而是几何体某种本性的代数体现。怎样代数地描述这个性质? 考虑所有闭链它们之间的加减,数乘,结果还是闭链,在其中把边缘链等同于0,这样得到的代数对象将不依赖于剖分几何体的方法,庞卡莱叫它 “同调群”。

现在来算球面的同调群。顶点都没有边界,但是两个顶点的差一定是一条边的边界,

A-B = d (BA)

按照庞卡莱的语言,A-B 是边缘链,将被等同于 0, 也就是说,在同调群中 A-B = 0, 或者说 A = B. 这样,本质上只有一个 0 维对象,
A = B = C = D,
它可以被整数乘,这样我们得到球面的 0 维同调群

{ … , -3A, -2A, -A, 0, A, 2A, 3A, …}

这个代数对象的加法,数乘,跟全体整数的加法,数乘是一样的,用数学的语言来说,球面的 0 维同调群 “同构于” 整数集。

1 维的链是六条边的组合,用代数运算(解线性方程组)或者几何直观都可以看到,没有边界的 1 维链总是由三边形的边界 ( AB + BC + CA ), ( BC + CD + DB), ( AB + BD + DA) 组成,按照庞卡莱的语言,球面上所有的 1 维闭链都是边缘链,都应该在同调群中等同于 0,所以1 维同调群是 0.

2 维的链是四个面的组合,x ABC + y ABD + z ACD + w BCD, 它是闭链的条件

d ( x ABC + y ABD + z ACD + w BCD ) = 0.

有兴趣的朋友可以动手算一算上面这个方程,比如第一项

d ( x ABC ) = x ( BC – AC + AB ) = x BC – x AC + x AB,

然后合并每条边的系数,令它等于零,就得到 6 个关于 x, y, z, w 的线性方程。这个方程组的解是 x = z = -y = -w. 这个结果说明球面上的每个二维闭链都可以写成

w ( BCD – ACD + ABD – ABC ),

也就是说,总是括号中闭链的整数倍。如果把括号里的闭链叫做 s, 那么球面的二维同调群就是

{ … , -3s, -2s, -s, 0, s, 2s, 3s, … }

同构于整数集。

综上所述,球面的 0 维同调群和 2 维同调群都同构于整数集,1 维同调群为 0. 再引入一个概念,同调群内含有多少个整数集,就说同调群的 “秩” 是多少。把不同维同调群的 “秩” 交错加减,即,0 维同调群的秩减去 1 维同调群的秩再加上 2 维同调群的秩再减去 3 维同调群的秩……, 得到一个整数。在简单例子里稍作计算,就会发现这个整数实际上是 0 维单形个数减去 1 维单形个数再加上 2 维单形个数再减去 3 维单形个数……,即,各维数单形个数的交错和。这个数大家其实颇为熟悉,在高中立体几何最后应该提到过,叫做 “欧拉示性数”,对凸多面体的表面,它就是 V – E + F, 而且总是等于 2. 实际上,所有凸多面体的表面在拓扑上都是球面,这个 2 就是球面的各维数同调群的 “秩” 的交错和,1 – 0 + 1 = 2.
显然,欧拉示性数是最容易计算的拓扑不变量,只需要找一个剖分,然后数数几个顶点几条边几个面......,再加加减减就行了。

同调群告诉我们哪些闭链不是边缘链,通俗一点说,告诉我们几何体里面哪些封闭的对象中空 的。它显然是比欧拉示性数更精细的拓扑不变量。有兴趣的朋友可以自己算算两个几何体的同调群:圆圈,轮胎面。(提示:先把它们剖分成单形。)

庞卡莱发现了同调群以后,拿它来区分了一些三维的对象后来他发现,同调群不够精。比如,跟三维球面(二维球面的高一维推广)具有相同同调群的几何对象不一定就是三维球面。这促使他寻找更精的拓扑性质。这次他想到几何体里头还有东西是可以运算的,就是道路。两条道路如果首尾相接组成一条新的道路,这就是道路的乘法。这里有两个问题需要处理,首先,不是任何两条道路都能相乘 (必须首尾相接才可以),然后,即使能相乘,乘法也不满足结合律,运算起来不方便。庞卡莱想到了办法解决这两个问题。他在几何体内取一个基点,只考虑那些从这个点出发再回到这个点的道路,这些道路当然互相首尾相连;然后他规定,如果一条道路能在几何体内经过连续变形到另一条道路 (见下图),这两条道路就被看作在同一个道路类 中,这样规定后,道路类 之间的乘法就满足结合律了。这些道路类也组成一个代数对象,有乘法运算,这个对象叫做几何体的 基本群,或者1 维同伦群

来点感性认识。线段的基本群只有一个元素,就是静止在基点的道路。线段里的其他任何从基点出发回到基点的道路都可以在线段内连续变形到静止在基点的道路。我们把只包含一个元素的基本群称为平凡的。再看圆周,它的基本群是所有整数组成的。绕圆周 n 圈的道路不能在圆周上连续变形到绕圆周 m 圈的道路,而把它们首尾相接的结果就是绕圆周 n+m 圈的道路,这里道路类之间的乘法体现为整数间的加法。第三个例子,球面,它的基本群是平凡的,因为球面上所有由基点出发的回路都可以在球面上连续变形(滑缩)为静止在基点的道路 (见左图)。具有平凡基本群的几何体称为 单连通的


基本群的计算涉及到更深入的细节,比如拓扑的具体定义,拓扑空间之间的映射,等等,无法在这里详加解释。有兴趣进一步了解的朋友请参阅 基础拓扑学》,阿姆斯特朗(M.A.Armstrong)著;孙以丰译。

发明了本群以后,庞卡莱觉得这个更加精确的拓扑性质应该足以把三维球面从其它三维几何体中区分出来,但他自己无法证明。这就是举世闻名的庞卡莱猜想:单连通的三维封闭几何体一定是三维球面。这个猜想及其推广主导了代数拓扑学一百年的发展,最终在2004年由俄罗斯数学家裴若曼给出证明。裴若曼因此在 2006 年获得数学界最高荣誉 —— 菲尔兹奖。

(四)

1854年,28岁的黎曼在哥廷根大学发表就职演讲。这个职位是所谓无薪讲师,他的收入完全来自于听课的学生所缴纳的学费。即使是争取这样一个职位, 也需要提供一篇就职论文以及发表一个就职演讲。1853年他提交了就职论文,其中讨论了什么样的函数可以展开成三角级数的问题,并导致对定积分的第一个严 格数学定义。之后的就职演讲要求候选人准备三个演讲课题,委员会从中挑选一个作为正式演讲题目。黎曼选了两个思虑多时的课题,外加一个还未及考虑的课题 ——关于几何学的基本假设。他几乎确信委员会将挑选前面两个题目之一。然而,委员会的高斯偏偏就看中了第三个题目。当时黎曼正沉浸于电、磁、光、引力之间 的相互关系问题,从这样的深沉思考中抽身转而研究新的问题无疑是一种巨大的压力,再加上长期的贫穷,一度让黎曼崩溃。但不久他就重新振作起来,用 7 个星期时间准备了关于几何学基本假设的演讲。为了让数学系以外的委员会成员理解他的演讲,黎曼只用了一个公式,并且忽略了所有计算细节。尽管如此,估计在场鲜有人能理解这次演讲的内容。只有高斯为黎曼演讲中蕴含的深邃思想激动不已。
黎曼在演讲中提出了 “弯曲空间” 的概念,并给出怎样研究这些空间的建议。 “弯曲空间” 正是后世拓扑学研究的主要对象。在这些对象上,除了可以运用代数拓扑的工具,还可以运用微积分工具,这就形成了 “微分拓扑学”。
回到黎曼的演讲。黎曼认为,几何学的对象缺乏先验的定义,欧几里德的公理只是假设了未定义的几何对象之间的关系,而我们却不知道这些关系怎么来的, 甚至不知道为什么几何对象之间会存在关系。黎曼认为,几何对象应该是一些多度延展的量,体现出各种可能的度量性质。而我们生活的空间只是一个特殊的三度延展的量,因此欧几里德的公理只能从经验导出,而不是几何对象基本定义的推论。欧氏几何的公理和定理根本就只是假设而已。但是,我们可以考察这些定理成立的可能性,然后再试图把它们推广到我们日常观察的范围之外的几何,比如大到不可测的几何,以及小到不可测的几何。接着,黎曼开始了关于延展性,维数,以及将延展性数量化的讨论。他给了这些多度延展的量(几何对象)一个名称,德文写作 mannigfaltigkeit, 英文翻译为 manifold,英文字面意思可以理解为 “多层”,中国第一个拓扑学家江泽涵把这个词翻译为 “流形”,取自文天祥《正气歌》,“天地有正气,杂然赋流形”,而其原始出处为《易经》,“大哉乾元,万物资始,乃统天。云行雨施,品物流形。” 这个翻 译比英文翻译更加符合黎曼的原意,即多样化的形体。
黎曼定义的 “n 维流形” 大概是这个样子的:以其中一个点为基准,则周围每个点的位置都可以用 n 个实数来确定。后人将这种性质总结为:流形的局部与 n 维欧氏空间的局部具有相同的拓扑性质。如果进一步要求在流形的不同局部做微积分的结果可以互相联系起来,成为 “整体微积分”,则称此流形为 “微分流形”。一个简单的例子就是二维球面。我们都知道,二维球面上没有整体适用的坐标。经度和纬度是一组很好的坐标,但是在南北两极,经度无从定义。尽管如此,球面的每个局部都可以画在平面上,这就是地图。把各个区域的地图收集在一起,重叠的部分用比例尺协调一下,就得到整个球面。这样,坐标(或地图) 只存在于每个局部,而整个球面其实是地图之间的重叠关系。球面是二维流形,因为球面的局部同平面(二维欧氏空间)的局部具有相同的延展性质。球面的整体结构显然跟平面不同。沿着球面的某个方向往前走,比如,从赤道某点出发往东走,最终会回到出发点。而如果在平面上沿某个方向往前走则永不回到出发点。研究流形的整体结构,以及整体结构与局部结构之间的关系,就是 “拓扑学” 的核心课题。微分流形上可以使用微积分的工具,再辅之以前面介绍过的代数工具(同调群,同伦群),就形成了威力强大的 “微分拓扑学”。这门学问的发展使我们对 5 维以上的单连通微分流形(回忆先前介绍的 “单连通” 概念,即每条曲线可于流形内滑缩为一点)有了比较彻底的认识。
到了80年代,数学家对 4 维单连通 “拓扑流形” 也有了彻底的认识,然而 4 维 “微分流形” 却是无比复杂的对象。比如,直观上最简单的四维流形,四维欧氏空间,也就是所有 (x,y,z,t) 这样的数组组成的空间,有无穷多个“微分结构”,通俗一点说,这个流形上有无穷多种 “整体微积分” 可做,而我们通常做的四元微积分只是其中一种。这是 4 维的特殊性,因为其他维数的欧氏空间都跟我们的常识相符。也许 “4” 就是传说中的上帝之数,我们的宇宙就是用 4 个参数来描述的(3个参数表示空间,1 个参数表示时间),我们的时空是一个四维流形。
如果我们忘掉时间,只考察我们生活的空间。它的形态会是怎样?这是黎曼在演讲结尾提出的问题。这个问题到现在还没有答案。这个答案需要物理学家、天文学家、宇宙学家去寻找。宇宙空间会不会是一个三维球面?如果是三维球面,那我们沿着一个方向往前飞行,最终总会回到起点。
(五)---- 爬虫的世界

黎曼所描述的几何经常被形容为 “爬虫的几何”,因为黎曼假设观察者处于流形内部。对人类来说,二维流形是非常直观的对象,它们通常被称为“曲面”。而三维流形却难以想象,正因为我们处于宇宙空间这个三维流形内部。爬虫几乎是二维的生物,它们靠爬行来感知周围世界。1884年英国小说家 E. A. Abbott 的科幻小说《平面国》描述了真正的二维爬虫,以及它们对额外维(仅仅是第三维)的恐惧不安。
现在让我们体会一下二维爬虫的世界。假设这个世界是一个二维球面,任何事件都发生在这个球面上。最重要的是,光线沿着球面传播。而我们人类可以从外部观察这个二维球面世界。古希腊数学家就已经知道,球面上连接两点的所有曲线段中存在最短者,即以球心为圆心的弧(称为“大圆弧”)。爬虫通过测量也能发现这个最短线段,但在爬虫的世界里,“球心”并不存在。我们假设爬虫的光学定律也要求光线沿短程线传播,所以二维球面上的光线,即短程线,在人类看来是一些大圆弧。一个处于球面上 P点处的光源发出的所有光线沿着大圆传播,它们将汇聚于 P 的“对极点” P’ (人类倾向于定义对极点 P’ 为三维空间中连接 P 和球心的直线与球面的另一交点;而爬虫将定义对极点为离 P 最远的那个点)。爬虫们实际上看到两个发光点 P 和 P’,一个是真实的,另一个是像(按高中物理的说法,P’ 处的发光点是 P 处光源的“实像”)。这是因为光线在 P’ 汇聚之后再次散开,眼睛将告诉大脑这些光线是从 P’ 发出来的。有延展的物体,比如一个四边形爬虫,不妨设它的眼睛长在“前边”。那么它往前看将看见自己的“后边”,往左看将看见自己的“右边”。它看到了自己在“远方”成的像。有多远?圆周率乘以这个二维世界的半径。有趣的是,对于正好处在此爬虫对极点的观察者而言,爬虫“无处不在”,往任何一个方向看都能看到爬虫,非常恐怖的景象。这个世界的另一个显著特点是,它“有限无边”。如果爬虫认定一个方向往前爬,它可以永远爬下去,不会碰到“世界的边缘”,此即“无边”;而如果爬虫会丈量面积,那么它发现这个世界的总面积是有限的,如果它一直往前爬,它会一次又一次地回到起点,此即“有限”。
有限无边的二维流形当然不必是球面。比如,爬虫的世界完全可以是我们人类所谓“轮胎面”,数学家叫它“环面”。在这样一个世界里,房地产开发商将是一个危险的职业,因为有时候画了一个圈来圈地,结果什么都没有圈进去。比如轮胎上的经线圈和纬线圈。脑满肠肥的开发商们应该庆幸我们人类脚下正好是一个球面,随便画个圈都会有收获。言归正传,数学家们发现我们人类观察到的轮胎面并非其最自然的形式。 这个二维流形更自然的模型是把一个正方形的对边等同起来。这是一个奇怪的世界,光线在正方形内沿直线传播,当你疑惑光线到达正方形的上边缘以后将往何处去时,你忘记了这个世界是“有限无边”的,上边缘和下边缘是同一条线,所以光线又从下边缘射上来。这个世界里,点光源不会成像,因为它发出的光走的是平面上(正方形内)的直线,正常发散,永不重聚。但是爬虫仍然会看到远方的自己。与球面世界不同的是,爬虫会看到无穷多个自己:朝任何一个斜率为有理数的方向看,就会从某个角度看到自己。怎么理解这个现象?可以用这个正方形的无穷多个复制品地板砖式地铺满整个平面,每一个这样的正方形都被解释为同一个环面世界。光线在环面世界里的传播就可以从光线在平面上的传播读出来:在平面上画一条无限延伸的直线,这条直线在某个正方形 S 中划出一条线段 C,然后进入到另一个正方形 S1,划出另一条线段 C1,我们按照 C1 在 S1 中的位置将它复制到 S 中,同线段 C 一起构成环面世界里光线的一段轨迹。这种“地板砖”式构造在拓扑学中称为“泛复叠”,其目的是用一个具有高度对称性的简单拓扑空间来研究一个比较复杂的拓扑空间。对环面而言,平面就是这个简单拓扑空间,而其对称性就是左右平移和上下平移。我们看到,在这个“泛复叠”里,一个爬虫被复制成了无穷多个,处于每个正方形的相同位置。连接任意两个复制品,得到一条斜率为有理数的线段,根据我们刚才关于光线的分析,平面上的这条线段代表环面上一条起于爬虫而止于爬虫的光线。所以,沿着这个方向爬虫将看到自己的某个侧面。数学家设计了一些环面上的小游戏,比如迷宫、台球、象棋等等,有兴趣的朋友可以到 http://www.geometrygames.org/ 去下载体验一下。
其它的二维流形称为“多环面”。(这里我们只谈论有限无边的,而且“可定向”的二维流形,像莫比乌斯带那种“单侧”的流形不在我们考虑之列。)这些流形也有最自然的模型,由“双曲平面”上的多边形粘合而成。这样的世界里,光线传播得更奇怪一些,它们发散得特别厉害。光线的发散性质不是拓扑性质,它依赖于我们所选的模型,即数学家所谓“黎曼度量”。发散性质反映了黎曼度量的“曲率”,弯曲程度。如果光线从某一点向周围“线性发散”,即光强随距离线性减弱,则流形在这一点是“平直的”。球面上光强减弱得比较慢,因为相对于平直空间(欧氏空间)来说球面上的光线倾向于“汇聚”,这是“正曲率”的标志;而多环面上的光强减弱非常快,这是“负曲率”的标志。黎曼度量和曲率是另外一个话题,跟爱因斯坦的广义相对论有关,就不赘述了。之前考虑二维世界的时候引进拓扑之外的结构——黎曼度量,是因为度量可以更好地帮助我们想象比较奇怪的拓扑结构,比如环面及其“泛复叠”。
充分地理解了可怜的爬虫以后,我们可以“顾影自怜”了。我们的宇宙是什么样子的?是不是一个“三维球面”?宇宙中某个光源发出的光线是否汇聚到对极点,那最遥远的地方?或者是一个“三维环面”?四面八方都应该是我们自己,而我们看不到无穷多个自己只不过是因为宇宙太宽广而光线在传播过程中消耗殆尽?或者,宇宙根本就不是“有限”的,这似乎更符合大多数人的信仰。即使是有限宇宙,由于维数更高,其可能形态比二维流形更多,至今数学家还未能将它们穷尽。

(六)
前面几篇简要涉及了代数拓扑、微分拓扑、低维拓扑,如果大伙儿还不知道这些是啥,请复习拙著:)。其实,拓扑的概念和方法已经渗透到整个数学,而不仅限于拓扑学研究本身。
很多文献会提到,拓扑学起源于柯尼斯堡七桥问题,以及与此相关的一笔画问题。欧拉解答了这个问题。同样是欧拉,给出了第一个拓扑不变量,多面体表面的欧拉数(点数-边数+面数)。可以认为欧拉是第一个研究代数拓扑学的人(虽然莱布尼兹曾经臆想过)。
传说中高斯当年是德国国土局的领导,负责丈量土地。他由此观测到山脊附近的地面弯曲性质可以用内在的测量方法得到(所谓曲面的内蕴几何),他还定义了度量曲率大小的量(高斯曲率),并且将这个局部定义的、可以用微积分计算的量同整体定义的欧拉数联系起来(高斯-博内定理),所以他可以被追认为研究微分拓扑的第一人。当然,高斯的主业其实是政府工作、开创现代数论、以及电磁学。业余时间研究一下各种误差的分布啊,欧几里德的几何原本有什么错误啊之类的小问题作为消遣。
第二尊菩萨,黎曼同学,除了开创流形的几何学、发展了傅立叶分析和积分理论、研究了一下素数分布提出世界第一难题黎曼猜想之外,他不到40岁的短暂一生的其余时间基本上都在思考复变函数的问题。为什么有的复变函数是多值的?比如平方根和对数。能否把它们以某种方式变成单值函数?人们的思维定势是,既然函数是多值的,就像一条横着的抛物线,一个 x 对应到两个 y, 要变成单值很容易啊,砍掉抛物线的一半就行了。黎曼不这么看。他觉得,如果把函数图像本身作为定义域,每个点当然只对应到一个 y. 这样函数就变成单值的了,而且没有丢掉任何信息。如果是复变函数,其图像就是一个二维曲面,这就是黎曼曲面。黎曼曲面上有很多复杂的现象,这些现象催生了诸如连通性、单连通性、复叠空间这些拓扑概念,以及奇点、除子、函数域等等一些代数几何的概念。抛开代数几何不说,黎曼也许可以被屈尊为研究低维拓扑的第一人。
牛顿莱布尼兹发明了微积分之后,大家对无穷小无穷大这两个概念很不放心。为了让我们用得更安心,柯西和威尔斯特拉斯等人后来把无穷小解释得非常透彻,基本上就是说两个东西越来越近。“离得近”这个概念从而成为分析中最核心的概念。它正是所有拓扑学分支的共同基础——“点集拓扑”的起源。拓扑学在现实生活中的应用多数跟点集拓扑有关,即,通过分析“收敛性”体现在应用数学中。所以,最牛的牛顿被屈尊为研究点集拓扑第一人(有好事者不以为然,一定要扯到古希腊的阿基米德,这就见仁见智了。)
总而言之,拓扑学有着高贵的血统。当然,好汉不提当年勇,拓扑学的现在和将来如何?20世纪中叶,代数拓扑学朝着高度抽象的方向发展,两位名不见经传的数学工作者(艾伦伯格-麦克雷恩)突发奇想,从中总结出一套抽象语言。为了体现这套语言之形而上,他们重载了先贤亚里士多德的概念——范畴。继解析几何与微积分以来人类数学又一次在概念上经历了大变革。范畴论诞生了。20世纪数学的上帝——格罗登迪克,用7000页的数学圣经将拓扑学和范畴论全面而深遂地渗透到代数几何和数论研究中,改变了整个数学的风貌。与此呼应,世纪之交的物理学也在经历变革,量子场论和弦论呈现出绚丽多姿的数学结构。20世纪物理学的耶稣(上帝被爱因斯坦附身了)爱德华.威顿,身负绝世的拓扑神功,一经施展,整个理论物理学为之色变。拓扑学三位一体,必须要像生物学一样将21世纪纳入自己的势力范围。所以,在这个系列的结尾,让我骄傲地替拓扑学宣称:21世纪是拓扑的世纪!!
2012/.03/.24

漫谈几何量子化(转自繁星客栈)

漫谈几何量子化(一)小史

从数学上理解“量子化” 是数学物理的课题之一。应用量子理论来探索新的数学对象和新的数学性质,根据某些学者提议,可以叫做 “物理数学”。自从量子力学诞生,数学家就一直在思索量子化的数学本质。我个人来揣度 Weyl 当初对量子化的理解,可以说是用代数来细化几何。 在广义相对论提出以后,量子力学尚在酝酿之时,Weyl 已经试图把电磁学纳入几何框架,即所谓 U(1) 规范场论。在他看来,经典物理基础理论对应于几何。矩阵力学和波动力学出现以后,Weyl 第一个从数学上描述了量子力学,这就是他的著作《群论与量子力学》,他的语言基本上是当时的抽象代数。“经典物理用几何描述, 量子物理用代数描述”,这可以视为对量子化的一种理解。

矩阵力学和波动力学统一在“变换理论”框架下,这使得具有深刻分析背景的 von Neumann 意识到,某种函数空间上的微分算子理论对应于波动力学,而这种空间的代数结构可以用来归纳矩阵力学。因为这种函数空间已经被 Hilbert 的学生 Schmidt 研究过,而大家普遍相信是 Hilbert 的思想引导了对这种函数空间的研究,所以 von Neumann 用了 Hilbert space 这个名字。 据数学史研究者澄清,Hilbert space 的主要思想基本来自于 Schmidt 本人。von Neumann 的名著〈量子力学的数学基础〉用分析和代数的结合体 --- 算子代数来描述量子物理,他的基本定理是 Stone-von Neumann 定理:由坐标和动量生成的“Heisenberg 代数” [Q,P]=\mathrm{i}\hbar 只有唯一的自伴表示等价类,其中一个代表的表示空间是坐标的平方可积函数空间,坐标和动量分别表示为算子

(Qf)(q)=q\,f(q), \quad Pf= -\mathrm{i}\hbar D_q f.

这种对量子理论的理解可以大致总结为“非交换”观点,因为 Hilbert 空间 L^2 可以被理解为来源于力学变量的“非交换性”(更准确地说是“几乎交换性”)。由 von Neumann 这一脉相承而来的是我个人认为最有希望切入量子化本质的“非交换几何”。

漫谈几何量子化(二)闲话

Feynman 发明了路径积分以后,量子理论看起来便不那么反传统了,路径积分的被积函数都是经典的,交换的力学量,被一个幺模复值泛函 \mathrm{e}^{\mathrm{i}I/\hbar} 加权,得到经典观测值。由量子力学的概率解释,经典观测值应该是可观察量特征值的期望,这样路径积分非常像概率模型,权泛函就像概率密度一样。这里其实我很不理解的是,作为传播子(又叫 Green 函数或基本解),

\int_{\{\textrm{paths}\ \omega\ \textrm{from a to b}\} } \mathrm{e}^{\mathrm{i}I(\omega)/\hbar}\ \mathcal D\omega

的模方是粒子从 a 到 b 的迁移概率,而权函数本身的模方永远是 1,因而不能被视为任何同概率密度有关的量。从这个角度来说,可观察量 \mathcal O 的期望为什么是

\frac{\int \mathcal O(\omega)\ \mathrm{e}^{\mathrm{i}I(\omega)/\hbar}\ \mathcal D\omega}{\int \mathrm{e}^{\mathrm{i}I(\omega)/\hbar}\ \mathcal D\omega}

是非常难以理解的一个巧合。

在从算子描述推演路径积分的过程中,如果用虚时间,就得到完美的概率解释。这相当于考虑欧氏指标的时空背景。在这种数学模型中,量子理论可以理解成某些无穷维空间上的特殊概率测度理论。由于路径积分在 non-abelian 规范理论,弦论中的关键作用,这个解释也是很多数学物理学家努力探索的方向。近些年在随机面的数学理论方向有很多发展,这相当于研究二维欧氏时空量子理论的数学基础。

在“一维欧氏时空”,量子的运动完全由 Brownian motion 的数学理论刻画。显然,这种刻画不适用于真实世界,因为时间是实数而不是虚数。Brownian motion 非常适合描述股票等金融产品的价格随机性,如今已广泛用于金融市场理论。股票价格可以视为以时间为指标的一个随机过程(或者本质等价的,路径空间上的一个高斯测度),而随机面理论相当于研究有两个实指标的随机过程,我们应该期望这个理论会有一些跟我们社会生活相关的重要应用。

对于量子这个概念有着许多种不同理解,也许说明这个概念还不是基本概念(至少从数学上来说)。现在言归正传,说说量子化与几何的微妙关系。

漫谈几何量子化(三)源头

先从有限维自由度系统的量子化说起。最简单的是一维谐振子,其 Hamiltonian 是

H= \frac{p^2}{2m} + \frac12 m\omega^2q^2.

经典相空间是余切丛 (T^*\mathbb R, \ \Omega=dq\wedge dp), 正则量子化把坐标和动量看成算子,满足交换关系

[Q,P] = \mathrm{i} \hbar \{q,p\} = \mathrm{i} \hbar.

如果要求这个系统描述一个粒子的运动,态空间必须是不可约的,而以上交换关系的所有不可约表示都等价于前面提到的 Schrodinger 表示,表示空间是坐标的平方可积函数空间,坐标表示为乘法算子,动量表示为求导算子。Hamiltonian 现在成为一个线性微分算子,如果要求波函数在无穷远消失,Hamiltonian 的谱必须是离散的,而它本身是正定算子,所以存在最小本征值,所属的本征波函数代表的态叫做“真空”,可以显式解出。

从数学上来说,以上过程相当于先利用经典相空间上的辛形式定义出一个 Lie 代数 --- Heisenberg 代数,再直接运用 Stone-von Neumann 定理写出 Heisenberg 代数的唯一自伴表示,表示空间里的真空态则由 Hamiltonian 的本征值问题给出。用物理学的说法,这相当于在 Schrodinger 表象或者(等价的)动量表象中进行计算。

现代量子力学教材上常见的是使用 Fock 表象,即构造复变量

z=\sqrt{\frac{m\omega}{2\hbar}}\ \left(q+\frac{\mathrm{i} p}{m\omega}\right),
正则量子化把这个复变量看作算子,满足 [Z,\overline{Z}]=1. 如果有一态矢满足 Z|0\rangle=0, 那么所有矢量

\sum_{n=0}^\infty c_n\overline{Z}^n\ |0\rangle
组成以上交换关系的不可约表示,从而可以被视为单粒子系统的态空间*。容易看到在 Schrodinger 表象下,|0\rangle = \mathrm{e}^{-m\omega q^2/2\hbar} 满足以上湮灭方程。既然对所有多项式 p, p(\overline{Z})\ \mathrm{e}^{-m\omega q^2/2\hbar} \in L^2(\mathbb R), 而且它们组成稠密子集,所以从代数上构造的 Fock space 可以等同于从分析上构造的 Schrodinger 表示空间。

\overline{ \Big\{p(\overline{Z})\ |0\rangle \Big\}} = \Big\{ \sum_{n=0}^\infty c_n\overline{Z}^n\ |0\rangle \Big\} = L^2(\mathbb R).

从数学上来说,Fock 表象相当于在经典相空间上选取了一个“复结构”,使经典相空间成为一个复空间,而系统的态空间可以视为这个复空间上所有的“反全纯函数”组成的空间。这个空间如果要跟 Schrodinger 表象中的平方可积空间保持一致,我们选取的这个复结构就最好跟原来的辛结构有很密切的关系,这种“好”的复结构叫做辛空间上的“相容复结构”,后面再详细说明。

以上这两种从经典相空间构造态空间和真空态的方式,在数学中被总结为“实极化”和“复极化”,这里的“极化”当然跟物理学里的“极化”没有任何关系,我不知道这个名称的来源是什么。


*[注]:这种构造不可约表示的方法是 Lie 代数表示论的核心方法,“最高权表示”。至于是数学家先找到这种方法还是物理学家先找到这种方法,我没有仔细考证,不过 Elie Cartan 对 Lie 代数的分类应该在量子力学出现之前。
漫谈几何量子化(四)表象

在场论中,经典相空间一般都是无穷维空间。无穷维缺少有限维的一个重要性质,即平移旋转不变的 Lebesgue 测度的存在性。我们已经看到在 Stone-von Neumann 的处理中(即 Schrodinger 表示),平方可积函数空间 L^2(\mathbb R) 可以作为态空间,而平方可积是对 Lebesgue 测度而言的。但是在无穷维,没有这么一个“典则”的测度。

再来看 Fock 表象。重新审视对有限维相空间的处理。在没有约束的情况下,只要固定了坐标系,有限维相空间可以看作向量空间。所有可能的位置组成向量空间 V\cong \mathbb R^n,所有可能的动量应该被视为对偶空间(线性泛函组成的空间) V^*(这是因为动量由 Legendre 变换定义,数学上来说是一种对偶),使得经典相空间 可以写成 X=V\oplus V^*. 这是一个“辛向量空间”,就是说,上面配备了一个非退化的反对称双线性型 \sigma: X\times X\to \mathbb R,

\sigma\Big( (v_1,\alpha_1),\quad (v_2,\alpha_2)\Big) = \alpha_2(v_1)-\alpha_1(v_2)

实向量空间上的“复结构”是指一个线性变换,其平方是负恒等,J^2=-I. 辛向量空间上的“相容复结构”是指这个复结构要保持辛形式,即,

\sigma(Jx, Jy)= \sigma(x,y)\qquad \forall x,y

容易看到复结构的本征值是 \pm\mathrm{i}. 要谈论它的本征向量,必须把原来的实向量空间“复化”,即考虑复向量空间 X_{\mathbb C} = X\otimes \mathbb C = X\oplus \mathrm{i}\,X,把 J 扩张到这个复向量空间上成为复线性变换。这个复向量空间可以分解成 J 的本征子空间的直和,X_{\mathbb C}=W\oplus \overline{W}. 不同的复结构对应不同的这种直和分解。如果复结构还是跟辛结构相容的,那么以上直和分解必须满足“正性条件”

\mathrm{i}\, \sigma(\bar{w}, w)>0 \qquad \forall w\in W

和 Lagrange 条件,即 W 是极大的迷向子空间,所谓迷向是指

\sigma|_W =0.

之前讨论谐振子的时候采用的复结构是(省略系数)

W=\langle\ e_q+\mathrm{i}\, e_p\ \rangle,\qquad J(e_q)=-e_p,\quad J(e_p)=e_q

那么容易看到,Fock 表象中的态矢量一一对应到反全纯部分的多项式,用多重线性代数的语言,即 \overline{W} 上的对称张量。Fock space =S(\overline{W}).

这个程序可以用于无穷维辛向量空间,即,固定一个正性直和分解(复结构),态空间就可以用反全纯部分的对称张量来组成。不过注意这只适用于玻色理论,其中正则关系是交换子。对费米理论,有类似的程序,以后再谈。

真空态的构造问题涉及复结构的第三种形式,下节继续。

漫谈几何量子化(五)真空

在 Fock 表象中,真空态被全纯部分湮灭,Z|0\rangle =0. 现在考查有限维相空间,取一个一般的复结构 (V\oplus V^*)_{\mathbb C}=W\oplus \overline{W},希望把“全纯部分”的元素用某种方式写出来。

先来说明,投影 W\to V_{\mathbb C}:\ (v,\alpha)\mapsto v 是同构。首先,它是单射,这是因为,如果 0\neq w=(0,\alpha)\in W, 那么

\mathrm{i} \sigma(\bar{w},w) = \mathrm{i} (\bar{\alpha}(0)-\alpha(0)) = 0

与正性条件矛盾。又因为它们维数相同,所以是同构。(在无穷维的时候应该有其它办法可以论证这一点,我暂时还没有想到。)这样,对每一个 v\in V_{\mathbb C}, 有唯一的 (v, \alpha_v)\in W. 现在就可以定义线性算子

A: V_{\mathbb C} \to V^*_{\mathbb C},\quad Av=\alpha_v.

迷向条件说明这个算子作为 V^*_{\mathbb C}\otimes V^*_{\mathbb C} 的元素是对称的,而正性条件说明它的虚部是正定的。WA 的关系可以总结为:前者是后者作为映射的图像。

反之,只要有了一个虚部正定的对称双线性型 A,它的图像就给出一个复结构。这是辛向量空间上复结构的第三种形式--- Gauss 测度。现在“全纯部分”的元素可以写作 (v,Av).


上一节只说了经典相空间上的复结构,由谐振子的类比,态空间与反全纯函数空间同构。然而,还没有涉及可观察量及其在态空间上的作用。有限维情形,可以用 Stone-von Neumann 定理。在谐振子的时候用了 Schrodinger 表象,现在对于多维相空间,采用新的表象(等价于 Schordinger 表象),即,态空间是 L^2(V),

v\mapsto \mathrm{i}D_v,\qquad \alpha\mapsto m_\alpha, \ \textrm{meaning,}\ (m_\alpha f)(u)= \alpha(u)\,f(u)
计算交换子,

(D_vm_\alpha f)(u) = D_v(\alpha(u)\,f(u)) = \alpha(v)f(u)+\alpha(u)\,D_vf(u)

就是说,

[\mathrm{i}D_v, m_\alpha]= \mathrm{i}\ \alpha(v)\ \mathrm{id}= \mathrm{i}\ \sigma(\ (v,0),\ (0,\alpha)\ ).

这是 Heisenberg 正则量子化。

结合关于 Gauss 测度的讨论,来看什么样的函数被全纯部分湮灭。简单计算一下,

\mathrm{i}\,D_v\,\mathrm{e}^{\mathrm{i} (Au)(u)/2} = -(Av)(u)\ \mathrm{e}^{\mathrm{i} (Au)(u)/2}

形式地重写以上等式,

\Big(\mathrm{i}D_v+m_{Av}\Big) L_A = 0

左边括号里的算子其实是经典变量 (v,Av)\in W 在 Stone-von Neumann 表示里对应的算子。这个简单计算就是说,以上 Gauss 指数函数被全纯部分 W= \mathrm{Graph}(A) 对应的所有算子湮灭。相容复结构通过 Gauss 测度的形式给出了真空态。

总结一下:
(1)辛向量空间 V\oplus V^*,\quad \sigma\Big(\ (v_1,\alpha_1),\ (v_2,\alpha_2)\ \Big);

(2)V\oplus V^* 上相容复结构的三种形式:
(一)辛同构 J: V\oplus V^* \to V\oplus V^* \quad \mathrm{s.t.}\quad \sigma(Jx,Jy)=\simga(x,y);
(二)极大正性迷向子空间 W\subset (V\oplus V^*)_{\mathbb C}  \quad \mathrm{s.t.}\quad (V\oplus V^*)_{\mathbb C} = W\oplus \overline{W};
(三)V 上的 Gauss 测度 A, 即虚部正定的对称双线性型。

(3)选取一个相空间上的相容复结构,Fock 空间即为对称张量空间 S(\overline{W})=\oplus_{k\ge 0}S^k(\overline{W}). 它同平方可积函数空间L^2(V) 的关系如下:

S(\overline{W})\to L^2(V),\quad \bar{w}_1\cdots \bar{w}_s\ \mapsto\ \rho(\bar{w}_1\cdots \bar{w}_s)\ \mathrm{e}^{\mathrm{i}\,(Av)(v)/2}
这里 \rho 指 Stone-von Neumann 表示。

如果 V 是一个无穷维的拓扑向量空间,比如某个时空场方程的所有解在等时截面附近的“芽”(场的初值)组成的空间,那么以上概念和程序都依然有效(需要更加精细的定义)。相容的复结构将给出一个 Fock 表象及真空态。与有限维不同的是,所有这些 Fock 表象并不等价,而且平方可积空间没有自然的定义,这时候(3)里面的式子应当被视为在选取的相容复结构(Gauss 测度)意义下的 L^2(V)_A 的定义. 在一个带边的时空流形上,Lagrange 作用量和类空边界将给出经典相空间,时空内部(即系统的历史)将给出一个特殊的复结构,这个复结构帮助确定 Fock 空间及真空态。下一节准备将以上概念体现于自由玻色场。



参考文献:

Graeme Segal's notes on QFT.

Gerald B. Folland: Harmonic Analysis in Phase Space. (AM-122)

漫谈几何量子化(六)实例

一个带边的 n 维时空流形 M 上的自由玻色场作用量是

I=\int_M \Big(-\frac12 d\phi\wedge *d\phi -\frac12 m^2 \phi\cdot *\phi\Big)

或者更清楚一点,

I= \int_M \Big(-\frac12 \| d\phi\|^2 - \frac12 m^2 \|\phi\|^2\Big)\ dV

在它的类空边界 \partial M 上,可以进行“正则量子化”程序。首先,找到时空里的经典场位形,即,对作用量作变分,得到 Euler-Lagrange 方程 (Klein-Gordon)

 (\Box-m^2)\phi=0

这个方程的算子解 \phi(\mathbf x,t) 经常称为“在壳”的场。它们被视为相互作用图像中随时间演化的力学变量,在现在的自由理论情形,实际上也是 Heisenberg 图像中随时间演化的力学变量。在一个固定的时刻 t,不同空间位置的场算子  \{\phi(\mathbf x,t)\}_{\mathbf x} 组成系统的“正则位形”。经过 Legendre 变换,找到系统的“正则动量”空间 \{\partial_t\phi(\mathbf x, t)\}_{\mathbf x}. 所有的正则位形和正则动量实际上给出了 Klein-Gordon 方程的初值(或者末值),根据方程的性质,这组初值是颇为任意的,比如,对任何光滑的初值,总能找到方程的解。

如果一个类空边界分支 K\subset \partial M 是等时面,那么系统的经典相空间(所有正则位形和动量),用几何的语言,就是 \Omega^0(K)\oplus \Omega^{n-1}(K), 即,场的初值及法向导数。这里的记号分别指 K 上的 0 阶微分形式(即函数)和 (n-1) 阶微分形式。它们正好互为对偶,通过配对

(f, \alpha)\ \mapsto \ \int_K f\alpha

这个积分有意义是因为函数乘上顶阶形式还是顶阶形式,从而可以在流形上积分。这样经典相空间成为之前研究过的标准的辛向量空间。

要构造 Fock 表象和真空态,必须引进相容复结构。这个复结构来自于整个时空流形(可以被视为系统的历史,如果把经典相空间作为末值的话)。时空里场方程的所有解(在壳的场)组成空间 W, 它可以嵌入 \big(\Omega^0(K)\oplus \Omega^{n-1}(K)\big)_{\mathbb C} 作为子空间,

\phi\ \mapsto\  \Big(\phi |_K,\ \mathrm{i}\,(*d\phi)|_K \Big)

就是把场方程的解对应到其初值,再用虚数单位“扭”一下。这个映射是嵌入由初值问题解的唯一性以及连续依赖性保证(双曲方程好像没有这么好的性质,所以这里在严格性上有很大的问题,解决的办法是归结为另一个不够严格的过程---先用虚时间,把双曲方程化为椭圆方程,在完成量子化手续,算出散射概率或者关联函数以后再回到 Lorentz 时空指标)。

这么巧的是,这个嵌入的像定义了一个相容复结构,

\big(\Omega^0(K)\oplus \Omega^{n-1}(K)\big)_{\mathbb C} = W\oplus \overline{W}

这样就可以构造出 Fock 空间和真空态(有兴趣的同修可以考虑一下这里的细节)。事实证明,这个表象只依赖于边界 K 的邻域,而与任一有限时间之前的时空无关。这个现象,我还没有领会。盼熟悉物理的同修加以点拨。

漫谈几何量子化(七)流形


经典相空间一般都是辛空间,从历史角度来说就是可以写下 Hamilton 运动方程的空间。数学上把量子化总结为从一个辛空间出发构造 Hilbert 空间及其上一系列满足 Heisenberg 交换关系的算子的问题。谐振子的例子里,这个辛空间本质上只是一个向量空间,物理学家往往称这种空间为“拓扑平凡的”。数学上非常感兴趣的是,给一个“拓扑非平凡”的辛空间,量子化到底是什么意思。

一类拓扑非平凡的空间都落在一个比较好的范畴中,它们在数学上就叫“流形”。一个 n 维“流形”是一个拓扑空间,它的每个局部在拓扑上都等价于 \mathbb R^n 的开集,就是说,局部上每个点对应到 \mathbb R^n 的一个点,有一组坐标,这就是局部坐标系。两个局部重叠的地方,就有两个局部坐标系,它们相差一个坐标变换。由以上定义,这些坐标变换自然是拓扑等价(即双方连续的一一对应)。如果其中某些坐标变换还是无穷次可微的,而且它们涉及到的局部可以合起来覆盖整个流形,那么这个流形就是“光滑”的。把所有互为光滑变换的局部坐标系都收集起来,它们叫做这个光滑流形的“容许坐标系”。

在光滑流形上,可以谈论“光滑”函数。一个函数如果在一个容许坐标系下是光滑的,那么在另一个重叠的容许坐标系下也光滑,因为坐标变换是光滑的。通常这么叙述这种好处:光滑性不依赖于局部坐标选取。在流形上,与局部坐标选取无关的“概念”,“性质”,和与局部坐标变换相容的“ 量”,才是有几何意义的。这一点,微分几何的创始人 Gauss, Riemann 应该都心里有数。Einstein 在他的物理学里也强调了这一点。

在流形上没有线性结构,不能把两个点加在一起,也不能连接两个点成为一个“向量”。不过在每一点的局部,就好像在欧氏空间一样,可以在这一点对函数“求方向导数”,这种运算是局部函数空间上的线性算子。以它们为模型的整体对象叫做在该点的“切向量”。在局部上还有一个有趣的东西就是函数在一点的“微分”,

df_a=\sum_i \left.\frac{\partial f}{\partial x^i}\right|_a\,dx^i

以它为模型的整体对象叫做一个“余切向量”(或者仍然叫做微分)。然后顾名思义,一个“光滑切向量场”就是在每一点有一个切向量,以光滑方式依赖于基点。对偶的概念是“微分 1-形式”,即,光滑余切向量场。在局部坐标系下,切向量场和微分 1-形式通常写成

X=X^i(x)\frac{\partial}{\partial x^i},\qquad \xi = \xi_i(x) \,dx^i

这里用了 Einstein 求和约定。系数都是局部坐标系里的光滑函数(但不是整体的光滑函数,将随坐标变换而变)。

在每一点上,由方向导数和微分组成的多重线性对象,以整体方式定义以后,叫“张量”。张量场跟前面类似。搞数学的喜欢用整体记号,就像上面那个式子一样,把分量和基写在一起,变换局部坐标的时候,基底和分量同时变,而它们的组合不变,从而左边的字母代表一个不依赖于局部坐标系的量;搞物理的喜欢只写出分量而省略基底,这样的记号明显依赖于局部坐标系。

漫谈几何量子化(八)力学

如果一个系统包含 N 个粒子,它们在空间的位置受到 s 个独立方程的限制。满足这些方程的位置组成 3N 维欧氏空间的一个子集 M, 称为“位形空间”。

F_i(x_1,y_1,z_1,x_2,y_2,z_2,\cdots, x_N,y_N,z_N)=0, \qquad i=1,\cdots, s

这些方程独立的意思是,Jacobi 矩阵 DF 的秩处处是 s. 根据隐函数定理,在 M 的每一点,存在一个邻域 U\subset M,在这个邻域里,可以找到 3N-s 个独立坐标函数,其它 s 个坐标函数由这 3N-s 个独立坐标的函数决定。这相当于说,M 的每个局部都拓扑等价于 \mathbb R^{3N-s} 的开子集,即,M 是一个 3N-s 维的流形。如果 F 还是光滑的,那么 M 是一个光滑流形。局部坐标系里的坐标就是 Lagrange 分析力学的“正则坐标”。

Lagrange 的方法是定义一个函数 L, 变量为正则坐标和该坐标点的“虚速度”(在考虑粒子运动轨迹之前,无法谈论速度。这里的虚速度是位形空间 M 的切向量,也就是粒子在这一位置的可能速度)。用流形的语言,指定一个切向量的同时,也就指定了它的基点,而所有切向量的集合称为“切丛”。所以 Lagrange 量 L 实际上是切丛上的函数。

Legendre 变换利用 Lagrange 量把虚速度变为动量。用流形的语言,就是把切向量映到余切向量,把切丛 TM 映到余切丛 T^*M. 在余切丛上,局部坐标是正则坐标和正则动量,它们满足 Hamilton 运动方程。它们的函数也满足相应的运动方程,而所有运动方程都能写成统一的形式,

 \frac{df(t,q(t),p(t))}{dt}= \frac{\partial f}{\partial t}+ \{f,H\}

这里的 Poisson 括号局部定义为

 \{f, g\} = \sum_{i=1}^{3N-s} \ \left(\frac{\partial f}{\partial q^i} \frac{\partial g}{\partial p_i} - \frac{\partial f}{\partial p_i} \frac{\partial g}{\partial q^i}\right)

Poisson 括号是双线性,反对称的,满足 Jacobi 恒等式和 Leibniz 法则,这里就不详述了。要用到的时候其意自明。需要单独列出的是,

 \{q^i, p_j\} = \delta^i_j

Hamilton 力学的特征被数学家总结为辛几何。位形空间的余切丛 T^*M(物理学家称为相空间)是所谓“辛流形”的范例。

漫谈几何量子化(九)几何

观察 Poisson 括号的形式,发现它隐含正则坐标和正则动量的反对称。这种反对称性被抽象为流形上的一个“二阶外微分形式”

\omega=\sum_i dq^i\wedge dp_i

它具有以下性质:它是闭形式,d\omega=0; 非退化;它是恰当形式,\omega=d(\sum q\,dp) = d(-\sum p\,dq).

如果想推广到一般流形,第三条性质似乎不是那么必要。仅凭前两条,已经基本可以模拟所有 Hamilton 力学的特征。带有这么一个闭的,非退化 2-形式的流形就叫做“辛流形”,这个形式就叫做“辛形式”。

现在用流形上整体的语言定义 Poisson 括号。首先,注意到辛形式是非退化的,所以我们可以利用它来实现“指标升降”,用数学的话来说,实现切空间和余切空间的同构。它可以把一个微分转化成一个切向量场。流形上的每个光滑函数给出一个微分 df, 用辛形式对偶一下,就得到由 f 给出的切向量场 X_f,满足如下等式,

\omega( X, X_f)= df (X) \qquad \forall X

要看到它跟 Poisson 括号的关系,需要 Darboux 定理:辛流形里每一点附近都存在一个局部坐标系,使得辛形式在该坐标系下具有之前写下的标准形式。这个定理给出一个好的局部坐标系,在这个坐标系下计算,

 X_f = \sum_i \left(\frac{\partial f}{\partial q^i}\frac{\partial}{\partial p_i}-\frac{\partial f}{\partial p_i}\frac{\partial}{\partial q^i}\right)

非常明显,Poisson 括号应该定义为

\{f,g\}= X_f\ g=dg(X_f) = \omega(X_f,X_g).

从这个定义立即看到双线性,反对称和 Leibniz 法则。要证明 Jocobi 恒等式,需要注意到 \mathcal L_{X_f}\omega=0, \quad \forall f\in C^\infty(M). 即,光滑函数通过辛形式给出的切向量场保持辛形式。一个重要推论是,

[X_f,\ X_g]=X_{\{f,g\}}

这个式子是如此接近 Dirac 量子条件。可以预料到它将直接与量子化相关。

Hamilton 力学如果用几何的语言来描述,就是说,辛流形上有一个特殊的光滑函数,叫做 Hamilton 函数,它通过辛形式产生的切向量场就是 Hamilton 正则方程。这组方程的解,几何上就是相应的切向量场生成的流形的单参数光滑同胚群,它描述系统的“相”随时间的演化。

漫谈几何量子化(十,十一,十二)

漫谈几何量子化(十)量子条件

“量子化”问题在数学上可以这么说:给一个辛流形 (M,\omega), 希望构造一个 Hilbert 空间,使得 M 上的函数对应到这个 Hilbert 空间上的算子,f\mapsto \hat{f}, 满足以下条件:(1)线性。函数的加法和数乘保持为相应算子的加法和数乘。(2)常函数对应到常数算子。这样物理常数才能作用于波函数。(3)Dirac 量子条件 [\hat{f}, \hat{g}]=\mathrm{i}\hbar \widehat{\{f,g\}}.

把量子条件和上一节提到的 Poisson 括号同切向量场的关系作一比较,发现 f\mapsto \mathrm{i}\hbar X_f 满足线性和量子条件。切向量场作为算子,作用于 M 上的光滑函数。包含光滑函数的 Hilbert 空间,最方便的当然是平方可积函数空间 L^2(M). 好像胜利就在眼前。可惜,常函数对应的切向量场是 0,不符合条件(2)。立即想到的办法是,稍微修正一下,f\mapsto \mathrm{i}\hbar X_f + \mathcal M_f. 这里 (\mathcal M_f \psi)(x) = f(x)\psi(x). 这样条件(2)满足了,再计算交换子,

[ \mathrm{i}\hbar X_f + \mathcal M_f,\ \mathrm{i}\hbar X_g + \mathcal M_g] = \mathrm{i}\hbar \Big(\mathrm{i}\hbar X_{\{f,g\}} + 2 \mathcal M_{\{f,g\}}\Big)

第一遍算的时候肯定会怀疑算错了,一切都那么完美,除了那个2倍。还需要再想办法修正。首先,必须保证条件(2),所以修正项最好含有 X_f. 然而希望消去的是一个“乘上函数”的算子,那么修正项最好也是乘上函数。从切向量场得到函数的办法,无非是用一个 1-形式 \theta 作用一下。看看最简单的例子,粒子的动量是相空间上的函数,它决定的切向量场是 -d/dq, 按照现在的计划,p\mapsto -\mathrm{i}\hbar d/dq -\theta(-d/dq)+p. 跟 Schordinger 表示相比较,发现  \theta = -p\,dq. 它是辛形式的“原形式”,d\theta=dq\wedge dp. 从这个例子得到提示,假设有一个 1-形式满足 d\theta=\omega, 那么可以把相空间上的函数对应到算子

\hat{f}= \mathrm{i}\hbar X_f -\mathcal M_{\theta(X_f)}+\mathcal M_f

计算交换子,

[\hat{f},\hat{g}] = \mathrm{i}\hbar \Big(\mathrm{i}\hbar X_{\{f,g\}}-\mathcal M_{X_f(\theta(X_g))}+\mathcal M_{X_g(\theta(X_f))} + 2 \mathcal M_{\{f,g\}}\Big)

再应用外微分公式

\omega(X_f,X_g)=d\theta(X_f,X_g)=X_f(\theta(X_g))-X_g(\theta(X_g))-\theta([X_f,X_g])

就得到完美结果 [\hat{f},\hat{g}]=\mathrm{i}\hbar\widehat{\{f,g\}}. 如果辛形式的确有一个“原形式”,那么以上构造就给出了 Hilbert 空间和代表可观察量的算子。需要指出,这并没有得到跟量子力学原理吻合的量子化,只要计算一下粒子的正则坐标对应的算子就能看到。其原因是,现在的 Hilbert 空间是坐标和动量的函数,而量子力学原理要求波函数要么只是坐标的函数,要么只是动量的函数。因此以上过程称为“预量子化”。

一般的辛流形,其辛形式并不是恰当的,就是说,不存在一个“原形式”。但是如果限制在局部,就像欧氏空间一样,闭形式总是恰当形式。因此在每个局部都可以进行预量子化。这显然强烈依赖于局部坐标的选取。怎样把这些局部的数据“拼接”起来是下一节要说的问题。

漫谈几何量子化(十一)丛与联络

取流形 M 的一个开覆盖,就是一族开集 \{U_\alpha\} 使得 \cup_\alpha U_\alpha =M. 它们可以取得比较好,比如,它们都同胚于欧氏空间,它们之间任意的交集也都同胚于欧氏空间。这种覆盖叫一个好的覆盖。它的好处是,在它们重叠的地方,Poincare 引理总成立:闭形式一定是恰当形式。

这样在每一个开集 U_\alpha 上,辛形式有原形式 \theta_\alpha. 上一节的程序就构造了算子 \hat{f}_\alpha,作用在局部的函数上,

 \mathrm{i}\hbar X_f\psi(x) -\theta_\alpha(X_f)\psi(x)+f(x)\psi(x)

如果 U_\alpha\cap U_\beta\neq \emptyset, 在这个交集上就有两个算子 \hat{f}_\alpha,\ \hat{f}_\beta,来自两个开集上的预量子化程序。它们作用在同一函数上得到不同的结果,相差  (\theta_\beta-\theta_\alpha)(X_f)\psi(x). 因为两个1-形式的外微分都是辛形式,所以在重叠部分它们的差是一个闭的 1-形式,这个闭的1-形式是局部恰当的,可以写成一个局部函数(定义在重叠部分)的微分,

\theta_\beta-\theta_\alpha=d\lambda_{\alpha\beta}

对每一对开集,都有这么一个定义在重叠区域上的函数。这些局部函数可以用来拼接局部数据。做法如下。既然来自于两个开集的算子作用在同一函数上得到不同结果,那么最好各司其职,只作用在自己那个开集的局部函数 \psi_\alpha 上。在两个开集重叠的部分,自然希望两个算子作用在各自的局部函数上得到的结果之间有某种简单关系。也就是说,希望把

 (\theta_\beta-\theta_\alpha)(X_f)\psi = d\lambda_{\alpha\beta}(X_f)\psi

吸收到某种简单关系中去。解过微分方程的人都比较熟悉的技巧是,将函数乘上积分因子可以把线性项吸收到导数之中。这提示我们可以通过积分因子 \mathrm{e}^{\mathrm{i}\lambda_{\alpha\beta}/\hbar} 将不同开集的局部函数联系起来,即,如果在 U_\beta 上取了局部函数 \psi_\beta, 那么在 U_\alpha 上就相应地取局部函数 \psi_\alpha = \mathrm{e}^{\mathrm{i}\lambda_{\alpha\beta}/\hbar} \psi_\beta, 再分别用 \hat{f}_\alpha, \ \hat{f}_\beta 作用,得到

\hat{f}_\alpha\psi_\alpha = \mathrm{e}^{\mathrm{i}\lambda_{\alpha\beta}/\hbar}\ \hat{f}_\beta\psi_\beta ,

也就是说,作用以后的局部函数之间的关系跟作用以前局部函数之间的关系是一样的。有了这个结果,就可以定义流形上一个整体的量(暂时叫做一个“波”),它在各个开集上的限制都是局部函数,在两个开集重叠的部分满足以上变换关系。再定义一个整体的算子,它作用在一个“波”上面,就是之前的分片作用 \{\hat{f}_\alpha\},作用之后,发现局部得到的结果还可以拼成一个“波”。(上一个式子保证这一点。)所以可以把所有的“波”放在一起组成一个空间,它上面有可观察量 \hat{f} 的作用。现在可以说,在辛形式不是恰当的时候,也可以做预量子化,只不过这个时候的 Hilbert 空间里面不再是流形上整体定义的函数了,而是由局部函数根据某种变换规则拼接起来的“波”。

以上的拼接过程并不严密。比如,如果有三个开集,两两相交,那么从开集1的局部函数得到开集3的相应局部函数的办法有两个:直接乘上1,3 之间的积分因子,或者先乘上1,2之间的积分因子找到开集2里相应的局部函数,再通过2,3之间的变换找到开集3里相应的局部函数。如果三个开集没有共同的部分,那就不会有什么问题。如果三个开集的交不空,在这个交上面,第三个局部函数的值可能因为上述两种方式而不相符。这就是说,如果局部函数要能拼接成一个整体对象,这些积分因子必须满足条件

 \mathrm{e}^{\mathrm{i}\lambda_{\alpha\beta}/\hbar}\ \mathrm{e}^{\mathrm{i}\lambda_{\beta\gamma}/\hbar}\ \mathrm{e}^{\mathrm{i}\lambda_{\gamma\alpha}/\hbar} =1, \qquad \textrm{or}\qquad \lambda_{\alpha\beta}+\lambda_{\beta\gamma}+\lambda_{\gamma\alpha} \in 2\pi\hbar\ \mathbb Z

这个条件并不容易满足。虽然这些和一定是常数(微分一下就看到了),不过注意到固定了 \theta_\alpha 以后,\lambda_{\alpha\beta} 的选取也不是唯一的,还可以加上任意的实常数。

这个整性条件有一个同调论的解释。在覆盖中的每个开集里取一个点,如果两个开集的交非空,就用一条线段连接两个开集里的点(使线段在它们的并里面),如果三个开集的交非空,就填入相应的三角形(也在并里面),...... 这些单形可能在流形中是退化的(比如二维流形的四个开集相交的情况)。流形的上同调可以用这个单纯复形来计算。特别地,容易看到辛形式 \omega 在每个这样的三角形上的积分都是  \lambda_{\alpha\beta}+\lambda_{\beta\gamma}+\lambda_{\gamma\alpha} 加上一些边界修正项。这样辛形式在单纯复形的一个2维闭链上的积分就等于所有这种形式的“三项和”加在一起(边界修正都抵消了)。因此,如果存在 \lambda 使得这些“三项和”都是 2\pi 的整数倍,那么辛形式 \omega 在 M 里的闭曲面上积分一定是 2\pi\hbar 的整数倍,或者用同调的语言,\omega/(2\pi\hbar) 所在的 de Rham 同调类一定要落在整系数同调群在实系数同调群的像里。

这一节已经涉及到了很不浅显的数学。将局部函数拼接成整体对象,在数学上是构造了一个 M 上的“复线丛”。一个“波”就是这个复线丛的一个“截面”。对任何 M 上的光滑函数 f 构造的算子的前两项(某个局部坐标系下)

\mathrm{i}\hbar \Big(X_f+\frac{\mathrm{i}\theta_\alpha}{\hbar}(X_f)\Big)

合起来称为“协变导数”,是流形上的整体对象,记作 \nabla_{X_f}. 它作用于线丛的截面。其中只在局部有定义的 1-形式 \theta_\alpha 称为“联络形式”,在坐标变换下作“规范变换”\theta_\beta= \theta_\alpha+d\lambda_{\alpha\beta}.

在对辛形式“整性”的分析中,用到了 Cech 上同调的想法,就是通过好的开覆盖的相交性质来计算和看待流形的同调群。那些“三项和”放在一起称为一个 Cech 2-上链,它来自于 “函数值的 Cech 1-上链” \lambda. 积分因子也组成一个“函数值的 1-上链”。“整性条件”用同调的语言,就是说这个积分因子的 1-上链是闭的。闭上链一般称为“上循环”。所以在一般的纤维丛上,转移函数(积分因子)需要满足这个“上循环”条件。Cech 上同调可以看作好的开覆盖给出的那个单纯复形的上同调。

用数学语言总结一下:对于辛形式满足整性条件的辛流形 (M,\omega),可以进行预量子化。首先,构造一个线丛和丛上一个联络,使得这个联络的曲率是 \mathrm{i}\omega/\hbar. 然后,取线丛的所有光滑截面,组成线性空间 V, 这些截面是“波函数”的推广。最后,对 M 上每一个光滑函数 f(经典力学变量),构造作用在 V 上的算子 \hat{f}= \mathrm{i}\hbar \nabla_{X_f} + \mathcal M_f. 这些算子满足 Dirac 量子条件,且常数变量对应到常数算子。

虽然这里的数学很漂亮,但这还不是真正的量子化。要同量子力学原理相一致,需要去掉一些“波函数”(截面),还要在剩下的截面之间定义内积,使量子力学的概率解释有效。

漫谈几何量子化(十二)正则变换

量子力学的波函数只依赖于相空间的“一半”坐标。一般的辛流形没有自然的“坐标”,“动量”分离,或者说,在局部上有多种选择“坐标”“动量”分离的方式。在经典力学里,虽然有自然的坐标和动量,但仍然可以通过所谓“正则变换”选择新的“坐标”“动量”,它们没有物理上的含义,但可以把运动方程化为比较简单的形式。Hamilton-Jacobi 方法假定有一个正则变换可以把运动方程化为“最简”形式,然后得到这个变换的“生成函数”所满足的方程,这就是著名的 Hamilton-Jacobi 方程。

当年量子力学以两种形式出现,矩阵力学实现为 Hamilton 正则方程形式,波动力学受到 Hamilton-Jacobi 方程的启发。这不是偶然,因为早在19世纪初年,Hamilton 就已经非常深刻地理解了“波”和“粒子”的统一性。说到这里,想起来上周还看到这里图书馆门口放着有人还回来的 《Hamilton 论文集》。我自己一直没有勇气去读他的东西,但我想对于做数学物理的人来说,Hamilton 的全集值得挖掘。

现在用微分几何的语言描述一下正则变换和 Hamilton-Jacobi 方法。为了同先贤们保持一致,我们就研究最原始的辛流形---位形空间的余切丛 T^*Q. 首先来看这个辛流形上有趣的数学。

它上面的辛形式是恰当的,有一个原形式 \theta。在局部坐标下的表达式大家都很熟悉了。这个原形式有一个有趣的内在描述。它是一个 1-形式,要定义它,只需定义它在任何切向量 \xi \in T(T^*Q) 的值。这里涉及到两个投影,\Pi: T(T^*Q)\to T^*Q, \quad \pi_*: T(T^*Q)\to TQ. 定义  \theta(\xi) = -\langle \Pi\xi, \pi_*\xi\rangle. 这里的尖括号是 Q 的余切空间和切空间的配对。在局部坐标下,\theta= -\sum p_i\,dq^i. (这里的负号看上去很不和谐,它说明 \sum dp_i\wedge dq^i 才是更自然的辛形式。不过为了同经典力学保持一致,还是采用 dq 在前面的辛形式。)

位形空间的一个 1-形式 \alpha\in \Omega^1(Q) 是向量丛 T^*Q 的一个截面,也就是一个光滑映射 \alpha: Q\to T^*Q, \quad q\mapsto \alpha_q 使得 \pi\circ \alpha =\mathrm{Id}_Q。有趣的是,\alpha^*(-\theta) =\alpha, 因为

 (\alpha^*(-\theta))_q(X)=-\theta((\alpha_*)_qX) = \langle \alpha_q, X_q\rangle

\alpha 的像 R(\alpha) 与 Q 微分同胚。那么以上关系实际上意味着, \alpha 是闭形式当且仅当 R(\alpha) 是 Lagrange 子流形,即,辛形式在其上的限制恒等于0的极大子流形。局部上闭形式是恰当形式,所以局部上存在 Q 上的函数 S, 使得 dS =\alpha. 这个函数叫做相应的 Lagrange 子流形 R(\alpha) 的“生成函数”。

下面先把正则变换同 Lagrange 子流形联系起来,这样正则变换也会有生成函数。本来正则变换是在一个相空间上发生的,但为了让符号更清晰,来看两个同维数的位形空间。正则变换就是保持辛形式的微分同胚,

\rho: T^*Q\to T^*Q' \qquad \textrm{such that}\qquad \rho^*\omega'=\omega

两个辛流形的乘积还是一个辛流形 (T^*Q\times T^*Q', \ \omega+\omega'). 计算两个辛形式的和在正则变换的“图像”Gr(\rho) =\{(m,\rho(m))\ |\ m\in T^*Q\} \subset T^*Q\times T^*Q' 上的限制,

 \omega(\xi)+ \omega'(\rho_*\xi) = \omega(\xi)+\rho^*\omega(\xi) = \omega(\xi)+\omega(\xi)

如果其中一个辛形式有个负号,就正好抵消。引入“反正则变换” \bar{\rho}(\alpha_q)= -\rho(\alpha_q),则它的图像 Gr(\bar{\rho}) 是乘积空间的 Lagrange 子流形。

要写出这个 Lagrange 子流形的局部生成函数,需要它局部上是一个 Q\times Q' 上的 1-形式的图像。引入局部辛坐标,假定 \rho: (q,p)\mapsto (q',p'). 它对应的反正则变换 \bar{\rho}: (q,p)\mapsto (q',-p') 的图像如果是一个 1-形式 (\alpha_{(q,q')}, \ \alpha_{(q,q')}') 的像集,那么对任何 (q^*,{q'}^*)\in Q\times Q', 存在唯一的 p^*, 使得  \pi_1\circ \bar{\rho}(q^*,p^*) = {q'}^*. 由隐函数定理,这个方程在局部有唯一解的条件是 Jacobi 矩阵 \partial q'/\partial p 处处非退化。解出 p^*=p^*(q^*,{q'}^*) 之后,记

{p'}^* = \pi_2\circ\rho(q^*,\ p^*(q^*,{q'}^*))=:p^*(q^*,{q'}^*)

则可写出 1-形式  p^*(q,q')dq - {p'}^*(q,q')dq', 它是闭的(因为对应于 Lagrange 子流形),所以局部存在原函数

S(q,q') = \int^{(q,q')} p^*(q,q')dq - {p'}^*(q,q')dq'

定义到相差一个常数。这个函数就称为正则变换 \rho 的局部生成函数。

反过来,如果有一函数  S(q,q')\in C^{\infty}(Q\times Q') ,它的微分给出 T^*(Q\times Q')= T^*Q\times T^*Q' 的一个 Lagrange 子流形。这个子流形可以实现为一个反正则变换的图像的条件为(用局部坐标),对任意 (q^*,p^*), 存在唯一的 {q'}^*, 满足方程

\frac{\partial S}{\partial q}(q^*,{q'}^*) = p^*

这个方程在局部有唯一解的条件是 Hessian 矩阵 \frac{\partial^2 S}{\partial q'\partial q} 处处非退化。解出  {q'}^*={q'}^*(q^*,p^*) 之后,得到 S 生成的局部正则变换

(q,p) \quad\mapsto\quad \Big({q'}^*(q,p),\ -\frac{\partial S}{\partial q'}(q, {q'}^*(q,p))\Big) .

看一个重要例子。经典系统的时间演化由一个相空间上的函数 H (Hamiltonian) 决定如下:它对应到切向量场 X_H, 而切向量场会在局部生成单参数变换群 \rho_t: T^*Q \to T^*Q. 这个群里每一个变换都保持辛形式,所以是正则变换。现在固定一个时间 t, 看怎样写出 \rho_t 的局部生成函数。回顾之前的讨论,首先要对任意 (q,q') 找到相应的 p 使得具有初相 (q,p) 的系统在 t 时间后位置为 q'. 这是 Hamilton 运动方程的边值问题。解边值问题,得到 (q(t),p(t)), 那么初动量和末动量就分别为 p=p(0) 和 p'=p(t). 这个由边值得到初动量的过程可以看作是一个局部微分同胚 h: Q\times Q\mapsto T^*Q . 这个微分同胚把我们寻找的 Q\times Q 上的 1-形式(见前面两段分析) “推进”到相空间上的 1-形式  -\theta +\rho_t^*\theta . 因为

\frac{d}{dt}(\rho_t^*\theta-\theta)= \mathcal L_{X_H} \theta = X_H\lrcorner d\theta + d(\theta(X_H)) = d(\theta(X_H)-H)

右边外微分符号里面实际上是 H 的 Legendre 变换,即 Lagrange 量。所以这个 1-形式在相空间上可以写成 Lagrange 量(作为相空间上的函数)的微分 dL 沿真实运动轨迹的积分

 \int_0^t dL(q(s),p(s))\ ds = d\Big(\int_0^t L(q(s),p(s))\ ds\Big)

很明显这个形式的原函数是所谓 “Hamilton 主函数”( Lagrange 量的时间积分)

\widetilde{S}(q,p,t) = \int_0^t L(q(s),p(s))\ ds \quad \textrm{with}\quad (q(0),p(0))=(q,p)

它是相空间上的函数(系统初相的函数)。而 Q\times Q 上的生成函数就是复合

 S(q,q',t) = \widetilde{S}(h(q,q'),t)

反过来,由这个生成函数得到等价于系统演化的一系列正则变换 \rho_t 的过程实际上蕴涵了所谓“Hamilton 原理”(最小作用量原理之一),即,系统用时间 t 从 q 到 q' 的真实演化使 S(q,q',t) 作为运动轨迹的泛函取到临界值。

用 Lagrange 子流形来代表正则变换,是几何学家 Weinstein 的创见。用这个观点来看待经典力学,更容易把正则变换,生成函数,系统演化之间的关系理清楚。

漫谈几何量子化(十三)


上一节联系了正则变换,Lagrange 子流形和生成函数。现在来寻找一个正则变换,使 Hamilton 正则方程组具有最简单的形式。

Hamilton 方程具有整体形式  \dot{\phi}_t = X_H (\phi_t) , 即系统的演化是由 Hamilton 量 H 的 “辛梯度”生成的。所以 Hamilton 方程在任何辛局部坐标下具有相同的形式。 如果能选取一个局部辛坐标系 (q',p') 使得 Hamiton 量只依赖于 q',而不依赖于 p', 那么 Hamilton 方程就成为

 \dot{q}' = 0 , \qquad \dot{p}' = -\frac{\partial H}{\partial q'} (q')

从而直接得到所有的解

 q' = a \ \textrm{(constant array)}, \qquad p' = b+ct

这里 a, b 是积分常数,由初始条件决定,而常数  c= -\frac{\partial H}{\partial q'} (a). 再用逆变换得到物理的坐标和动量 (q,p) 随时间的演化。

如果局部生成函数  S(q,q') 生成具有以上性质的变换,那么首先根据上一节

  p = \frac{\partial S}{\partial q}, \qquad p' = -\frac{\partial S}{\partial q'},

Hamilton 量独立于新正则坐标的条件为

 \frac{\partial H}{\partial p'} \left(q(q',p'),\ \frac{\partial S}{\partial q}(q(q',p'),\ q')\right) =0

这个条件等价于

 H\left(q(q',p'), \ \frac{\partial S}{\partial q}(q(q'p'),q')\right) = C(q') .

这里 C(q') 是只依赖于 q' 的数。

寻找满足这个条件的函数 S(q,q') 的方法就是解以下这个以 q 为变量,以 S(q) 为未知函数,以 C(q') 为参数的方程,

 H\left(q,\ \frac{\partial S}{\partial q}\right) = C(q')

这个偏微分方程就叫做不含时的 Hamilton-Jacobi 方程。如果这个方程有一族以 q' 为参数的解 S(q,q'), 则这一族解作为 (q,q') 的函数生成的变换 (q,p)\mapsto (q',p') 满足上一段那个较为复杂的条件,从而是此节开头要求的 “好” 的正则变换。

看看最简单的例子,一维谐振子。Hamilton-Jacobi 方程的形式为

 \left(\frac{\partial S}{\partial q}\right)^2+m^2\omega^2q^2 = C(q')

本质上是一个线性常微分方程,可以直接积分。做一个方便的选择,取 C(q')=(q')^2, 则得到一族解

S(q,q') = \frac{(q')^2}{2m\omega}\ \arcsin\left(\frac{m\omega q}{q'}\right) + \frac{qq'}{2}\ \sqrt{1-\left(\frac{m\omega q}{q'}\right)^2}

它生成的正则变换

q' = \sqrt{p^2+m^2\omega^2q^2},\qquad p' =\ \textrm{a complicated function}

是满足 \dot{q}'=0,\quad \" p'=0 的正则坐标。(新正则坐标 q' 实际上是 Hamilton 量的函数 \sqrt{2mH}, 在系统演化中守恒。)

当然,在谐振子的情况,直接解 Hamilton 方程要容易得多。其它很多系统也是如此。Hamilton-Jacobi 方法只有理论上的意义。

H-J 方程有一个几何解释。它的一个局部解 S(q) 生成相空间里局部的一个 Lagrange 子流形(dS 的图像),Hamilton 量沿着这个子流形是常数。H-J 方程的一族解就生成一族局部 Lagrange 子流形。如果这一族局部 Lagrange 子流形充满相空间的一个邻域(被新正则坐标 q' 参数化),那么它们给出新的非常方便的正则坐标(由 S(q,q') 生成的正则变换,每一 Lagrange 子流形就是新动量空间 \{(q',p')|\ q'=\mathrm{const}\ \})。

一般的辛流形并不一定能实现为某个位形空间的余切丛。寻找新的正则坐标在一般辛流形情形的类似过程就是 寻找 Lagrange 分叶结构,即,找一族 Lagrange 子流形来充满整个辛流形。波函数只依赖于一半正则坐标这个特点就被搬到一般辛流形上,成为 实极化这个概念。




漫谈几何量子化(十四)复极化

在辛向量空间量子化的例子里,实极化是 Schrodinger 表象,复极化是 Fock 表象。Fock 表象中的态矢量是复变量  q+ip 的反全纯函数。而数学传统用全纯函数讨论问题比较方便,所以在预量子化时做一个小变动,即让 Heisenberg 量子条件成为  [\hat{f},\ \hat{g}] = -i \widehat{\{f,g\}}. 这样预量子化得到的复线丛的曲率形式是  F=-i\omega.

如果 M 有一个复结构 J,而且复结构同原来的辛结构有某种相容性,即,M 在此复结构下是一个 Kahler 流形(选取这样一个 Kahler 结构叫做 “复极化”),那么复线丛的联络  -i\theta 给了复线丛一个 “全纯结构”,使它成为一个 “全纯线丛”,即可以选择 M 的开覆盖使线丛的转移函数是 M 局部的全纯函数。有了全纯结构,就可以谈论 “全纯截面”,即可以用转移函数拼成整体截面的局部全纯函数。这些 “全纯截面”是 Fock 表象全纯函数的推广,它们代表系统的不同状态。把所有的全纯截面收集起来,就得到了系统的态空间。如果想严格地得到 Hilbert 空间,就需要定义一个内积。这个内积可以由线丛的全纯结构自然给出。在这个内积下,取所有平方可积的全纯截面,就得到一个真正的 Hilbert 空间。如果 M 上的一个光滑函数 f 的 Hamilton 向量场保持复结构 J, 那么它在预量子化时对应的算子把全纯截面映到全纯截面,从而是态空间上的算子,这样的 f 被量子化了。由此,并非所有的经典力学变量都可以在几何量子化的框架中被量子化。保持复极化的力学量可以量子化,当然,还有一些不保持复极化的力学量在特殊的情况下也可以量子化。以后会谈到。

复极化方法使几何量子化同复几何联系起来,更有趣的是,同代数几何联系起来。这是因为, Kodaira 嵌入定理保证,对紧致 Kahler 流形 M,以上构造的这个线丛可以把 M 作为解析子流形嵌入复射影空间。这个结果加上周炜良定理(复射影空间的紧致光滑解析子流形一定是代数流形),就说明容许复极化的可量子化紧致辛流形一定是代数流形。(可量子化就是以上线丛的存在性。)

不妨看看最简单的代数流形,复射影直线 \mathbb C P^1,它自然是一个 Kahler 流形,它上面有自然线丛(射影直线上每一点是仿射平面里的一条直线),这个线丛的对偶线丛正好是预量子化线丛,它的全纯截面就是齐次坐标,所以量子化得到一个二维的 Hilbert 空间。以后会看到,\mathbb C P^1 是 spin-1/2 粒子的经典相空间,而量子化得到的二维 Hilbert 空间中的矢量就是自旋波函数。将复射影直线的辛形式乘上 k, 得到一个新的辛流形,它的预量子化线丛是原来预量子化线丛的 k 次张量积,这个新线丛的截面其实是 k 次齐次二元多项式,它们张成 k+1 维空间,这是 spin-k/2 波函数的取值空间。

这是一个很典型的 代数几何---表示论---几何量子化 相互关联的例子,它是所谓 Borel-Weil-Bott 定理在李群 SU(2) 时候的特殊形式。

漫谈几何量子化(十五) 时间演化

说年底之前要完成这个系列的,一转眼就到了。逝者如斯夫,不舍昼夜。各位一定要珍惜自己的黄金时代,多学多想多做。

在这一节也许应该谈谈 Schrodinger 方程了。一般认为这是量子力学最核心的基本假设。
几何量子化理论试图从经典几何的概念 “重构” Schrodinger 方程,注意,是重构,而不是导出。正如 sage 所说,量子化程序本身就是假设,即令通过这套程序使 Schrodinger 方程成为推论,也只能说明关于量子化程序的假设同关于 Schrodinger 方程的假设等价。何况,“极化” 的过程导致,并不是所有的经典力学变量都能实现为量子力学变量,特别的,并不是任意形式的经典 Hamiltonian 都能实现为态空间上的自伴算子。

现在回忆几何量子化程序。从一个辛流形出发,构造一个 “预量子化” 复线丛 L,再给这个线丛一个Hermitian 度量(即,在每一点定义复向量的长度),使得这个 Hermitian 度量的曲率正好是 -i\omega . 然后再取辛流形上一个 \omega 相容的复结构(复极化),这样 L 成为一个全纯线丛。取这个线丛的所有全纯且平方可积的截面,组成系统的 Hilbert 空间 V。

Schrodinger 方程给出系统状态的时间演化。在经典力学里,系统的时间演化由 Hamilton 函数的 “相流” 给出,即,由 Hamilton 函数 H 得到向量场 X_H , 使得 \omega(X,X_H) = dH(X) . 如果 X_H 生成单参数变换群 \rho_t: M\to M, 则必有  \rho_t^*\omega = \omega ,即,它一定是单参数正则变换群,它就是经典系统的时间演化。由向量场得到单参数变换群的过程,就是求解 Hamilton 正则方程组的过程。

如果假设 \rho_t 保持 “极化”(在复极化的情形,就是保持复结构,即每一变换都是全纯同胚),那么线丛 L 的每一平方可积全纯截面 s 被拉回到 L 的另一平方可积全纯截面  \rho_t^* s , 取值为  (\rho_t^* s) (x) = \rho_t^{-1} s(\rho_t x) 。而截面的时间演化是这个拉回的逆,\tilde{\rho}_t = (\rho_t^*)^{-1}: V\to V , 满足方程

 \frac{d}{dt} \tilde{\rho}_t s = \mathcal L_{X_H} s = -\,\frac{i}{\hbar} \hat{H} \tilde{\rho}_t s

这里 \hat{H} = 就是函数 H 的量子对应  i\hbar \nabla_{X_H} +\mathcal M_H .

以上是 Schrodinger 方程,但是这里假设了 \rho_t 保持极化。这个条件太强,以至于在最简单的情形下都不成立。所以需要寻找另外的办法来重构 Schrodinger 方程。如果 \rho_t 不保持极化,那么问题在于 \tilde{\rho}_t s 不再是全纯截面,但它仍然在一个更大的 Hilbert 空间里,就是 L的所有(不必全纯)平方可积截面空间 U. 令 pr 为 U 到 V 的正交投影,则总可以定义  s_t = pr (\tilde{\rho}_t s) \in V. 只是在正交投影以后,不能保证  \|s_t\| = \|s\| , 时间演化不一定幺正,或者说 Hamiltonian 不一定能实现为自伴算子。幸运的是,对物理中经常出现的 Hamiltonian, 这样定义的演化正好是幺正的。这个巧合还不能从数学角度理解。










2012/.03/.23

二十世纪的数学(Michael Atiyah)


谢谢邀请我来这里参加这个活动.当然,如果有人想谈论一个世纪的终结以及下一个世纪的开始,那么他有两个具有相当难度的选择:一个是回顾过去百年的数学;另一个是对未来百年数学发展的预测,我选择了前面这个比较困难的任务,任何人都可以预测未来而且我们并不能判定是对还是错.然而对过去的任何评述,每个人都可以提出异议.

我在这里所讲的是我个人的观点.这个报告不可能包含所有内容,特别是,有一些重要的内容我不准备涉及,一部分是因为我不是那些方面的专家,一部分也是出于它们已经在其他地方被评述过了.例如,我不会去谈论那些发生在逻辑与计算领域内的著名事件,
这些事件往往是与像Hilbert,Godel,Turing这些伟大的名字相关的,除了数学在基础物理中的应用之外,我也不会谈论太多数学的其他应用,这是因为数学的应用太广泛了,而且这需要专门的论述.每一个方面都需要一个专门的报告.也许大家在这次会议的其他报告中会听到很多关于这些内容的演讲.另外,试着罗列一些定理,甚至是列出在过去一百年的著名数学家的名字也是毫无意义的,那简直是在做枯燥的练习.所以,代替它们的是,我试着选择一些我认为在很多方面都是很重要的主题来讨论并且强调围绕这些主题所发生的事情.

首先我有一个一般性的说明.世纪是一个大约的数字概念.我们不会真地认为在过整整一百年的时候,有些事情会突然停下来,再重新开始,所以当我描述二十世纪的数学时,有些内容实际上可能是跨世纪的,如果某件事件发生在十九世纪九十年代,并持续到二十世纪初,我将不去计较这种时间方面的细节.我所做的就象一个天文学家,工作在一个近似的数字环境中.实际上,许多东西始于十九世纪,只不过在二十世纪才硕果累累.
这个报告的难点之一是很难把我们自己放回到1900年时作为一位数学家的位置上,这是因为上个世纪的数学有非常多的内容已经被我们的文化和我们自己吸收掉了.难以想象人们不用我们的术语来思考的那个时代是什么样子的.实际上,如果现在有人在数学上有一个真正重要的发现,其后他也一定会与之一起被忽略掉了!他会完全地被融入到背景之中,于是为了能够回顾过去,我们必须努力去想象在不同时代,人们用不同方式思考问题时的情景.

从局部到整体

作为开始,我准备列一些主题并且围绕它们来讨论.我谈论的第一个主题概括地讲,就是被大家称为从局部到整体的转变.在古典时期,人们大体上已经研究了在小范围内,使用局部坐标等等来研究事物.在这个世纪,重点已经转移到试图了解事物整体和大范围的性质.由于整体性质更加难以研究,所以大多只能有定性的结果,这时拓扑的思想就变得非常重要了.正是Poincaré,他不仅为拓扑学发展作出先驱性的贡献,而且也预言拓扑学将成为二十世纪数学的一个重要的组成部分,顺便让我提一下,给出一系列著名问题的Hilbert并没有意识到这一点.拓扑学很难在他的那些问题中找到具体体现.但是对Poincaré而言,他相当清楚地看出拓扑学将成为一个重要的内容.
让我试着列一些领域,然后大家就能知道我在想什么了.例如,考虑一下复分析(也被称为“函数论”),这在十九世纪是数学的中心,也是象Weierstrass这样伟大人物工作的中心.对于他们而言,一个函数就是一个复变量的函数;对于Weierstrass而言,一个函数就是一个幂级数.它们是一些可以用于写下来,并且可以明确描绘的东西或者是一些公式.函数是一些公式:它们是明确可以用显式写下来的.然而接下来Abe1,Riemann和其后许多人的工作使我们远离了这些,以至于函数变得可以不用明确的公式来定义,而更多地是通过它们的整体性质来定义:通过它们的奇异点的分布,通过它们的定义域位置,通过它们取值范围.这些整体性质正是一个特定函数与众不同的特性.局部展开只是看待它们的一种方式.
一个类似的事情发生在微分方程中,最初,解一个微分方程,人们需要寻找一个明确的局部解!是一些可以写下来的东西.随着事物的发展,解不必是一个显函数,人们不一定必须用好的公式来描述它们.解的奇异性是真正决定其整体性质的东西.与发生在复分析中的一切相比,这种精神是多么的类似,只不过在细节上有些不同罢了.
在微分几何中,Gauss和其他人的经典工作描述了小片的空间,小块的曲率以及用来描述局部几何的局部方程.只要人们想要了解曲面的整体图象以及伴随它们的拓扑时,从这些经典结果到大范围的转变就是很自然的了.当人们从小范围到大范围时,最有意义的性质就是拓扑的性质.
数论也有一个类似的发展,尽管它并不是很明显地适用于这一框架.数论学家们是这样来区分他们称之为“局部理论”和“整体理论”的:前者是当他们讨论一个单个的素数,一次一个素数,以及有限个素数时;后者是当他们同时讨论全部素数时.这种素数和点之间,局部和整体之间的类似性在数论发展过程中起了很重要的作用,并且那些在拓扑学发展中产生的思想深深地影响了数论.

当然这种情况也发生在物理学中,经典物理涉及局部理论,这时我们写下可以完全描述小范围性质的微分方程,接下来我们就必须研究一个物理系统的大范围性质.物理学涉及的全部内容就是当我们从小范围出发时,我们可以知道在大范围内正在发生什么,可以预计将要发生什么,并且沿着这些结论前进.

维数的增加

我的第二个主题有些不同,我称之为维数的增加.我们再次从经典的复变函数理论开始:经典复变函数论主要是详细讨论一个复变量理论并加以精炼.推广到两个或者更多个变量基本上发生在本世纪,并且是发生在有新现象出现的领域内.不是所有的现象都与一个变量的情形相同,这里有完全新的特性出现,并且n个变量的理论的研究越来越占有统治地位,这也是本世纪主要成就之一.

另一方面,过去的微分几何学家主要研究曲线和曲面,我们现在研究n维流形的几何,大家仔细想一想,就能意识到这是一个重要的转变.在早期,曲线和曲面是那些人们能真正在空间里看到的东西.而高维则有一点点虚构的成分,在其中人们可以通过数学思维来想象,但当时人们也许没有认真对待它们.认真对待它们并且用同样重视程度来研究它们的这种思想实际上是二十世纪的产物.同样地,也没有明显的证据表明我们十九世纪的先驱者们思考过函数个数的增加,研究不单单一个而是几个函数,或者是向量值函数(vector-valued function).所以我们看到这里有一个独立和非独立变量个数增加的问题.

线性代数总是涉及多个变量,但它的维数的增加更具有戏剧性,它的增加是从有限维到无穷维,从线性空间到有无穷个变量的Hilbert空间.当然这就涉及到了分析,在多个变量的函数之后,我们就有函数的函数,即泛函.它们是函数空间上的函数.它们本质上有无穷多个变量,这就是我们称为变分学的理论.一个类似的事情发生在一般(非线性)函数理论的发展中.这是一个古老的课题,但真正取得卓越的成果是在二十世纪.这就是我谈的第二个主题.


从交换到非交换

第三个主题是从交换到非交换的转变.这可能是二十世纪数学,特别是代数学的最主要的特征之一.代数的非交换方面已经极其重要,当然,它源自于十九世纪.它有几个不同的起源.Hamilton在四元数方面的工作可能是最令人惊叹的,并且有巨大的影响,实际上这是受处理物理问题时所采用的思想所启发.还有Grassmann在外代数方面的工作,这是另一个代数体系,现在已经被融入我们的微分形式理论中.当然,还有Cayley以线性代数为基础的矩阵方面的工作和Galois在群论方面的工作等.
所有这些都是以不同的方式形成了把非交换乘法引入代数理论的基石,我形象地把它们说成是二十世纪代数机器赖以生存的“面包和黄油”.我们现在可以不去思考这些,但在十九世纪,以上所有例子都以各自不同的方式取得了重大的突破,当然,这些思想在不同的领域内得到了惊人的发展.矩阵和非交换乘法在物理中的应用产生了量子理论.Heisenberg对易关系是非交换代数在物理中的一个最重要的应用例子,以至后来被von Neumann推广到他的算子代数理论中.

群论也是在二十世纪占重要位量的理论,我稍后再回来谈它.

从线性到非线性

我的下一个主题是从线性到非线性的转变.古典数学的大部分或者基本上是线性的,或者即使不是很精确的线性,也是那种可以通过某些扰动展开来研究的近似线性,真正的非线性现象的处理是非常困难的,并且只是在本世纪,才在很大的范围内对其进行了真正的研究.

我们从几何开始谈起:Euclid几何,平面的几何,空间的几何,直线的几何,所有这一切都是线性的.而从非欧几何的各个不同阶段到Riemann的更一般的几何,所讨论的基本上是非线性的.在微分方程中,真正关于非线性现象的研究已经处理了众多我们通过经典方法所看不到的新现象.在这里我只举两个例子,孤立子和混沌,这是微分方程理论两个非常不同的方面,在本世纪已经成为极度重要和非常著名的研究课题了.它们代表不同的极端.孤立子代表非线性微分方程的无法预料的有组织的行为,而混沌代表的是无法预料的无组织的行为(disorganized behavior).这两者出现在不同领域,都是非常有趣和重要的,但它们基本土都是非线性现象.我们同样可以将关于孤立子的某些工作的早期历史追溯到十九世纪下叶,但那只是很少的一部分.
当然,在物理学,Maxwell方程(电磁学的基本方程)是线性偏微分方程.与之对应的是著名的Yang-Mills方程,它们是非线性方程并被假定用来调控与物质结构有关的力.这些方程之所以是非线性的,是因为Yang-Mills方程本质上是Maxwell方程的矩阵体现,并且由矩阵不可交换这一事实导致方程中出现非线性项.于是在这里我们看到了一个非线性性与非交换性之间的有趣的联系.非交换性产生一类特殊的非线性性,这的确是很有意思和很重要的.

几何与代数
至此我谈的是一些一般性的主题,现在我想谈论一下数学中的一个二分叉现象,它来回摇摆却始终伴随着我们,这就给了我一个机会来做一些哲学上的思索和说明.我指的是几何和代数之间的二分法,几何和代数是数学的两个形式支柱,并且都有悠久的历史.几何学可以追溯到古希腊甚至更早的时期;代数学则源于古阿拉伯人和古印度人.所以,它们都已经成为数学的基础,但它们之间有一种令人感到不太自然的关系.
让我首先由这个问题的历史开始.Euc1id几何是数学理论中最早的一个例子,直到Descartes在我们现在称为的笛卡儿平面中引入代数坐标之前,它一直是纯几何的.Descartes的做法是一种将几何思考化为代数运算的尝试.从代数学家们的角度来讲,这当然是对几何学的一个重大突破或者说一次重大的冲击,如果我们来比较Newton和Leibniz在分析方面的工作,我们会发现他们属于不同的传统,Newton基本上是一个几何学家而Le1bniz基本土是一个代数学家,这其中有着很深刻的道理.对于Newton而言,几何学,或者是由他发展起来的微积分学,都是用来描述自然规律的数学尝试.他关心的是在很广泛意义下的物理,以及几何世界中的物理.在他看来,如果有人想了解事物,他就得用物理世界的观点来思考它,用几何图象的观点来看待它.当他发展微积分的时候,他想要发展的是微积分的一种能尽可能贴近隐藏在其后的物理内蕴的表现形式.所以他用的是几何论证,
因为这样可以与实际意义保持密切关系,另一方面,Leibniz有一个目标,一个雄心勃勃的目标,那就是形式化整个数学,将之变成一个庞大的代数机器.这与Newton的途径截然不同,并且二者有很多不同的记号.正如我们所知道的,在Newton和Leibniz之间的这场大争论中,Leibniz的记号最后得胜.我们现在还沿用他的记号来写偏导数.Newton的精神尚在,但被人们埋葬了很长时间.

在十九世纪末期,也就是一百年前,Poincaré和Hilbert是两个主要人物.我在前面已经提到过他们了,并且可以粗略地讲,他们分别是Newton和Leibniz的传人.Poincaré的思想更多的是几何和拓扑的精神,他用这些思想作为他的基本洞察工具.Hilbert更多的是一个形式主义者,他要的是公理化,形式化,并且要给出严格的,形式的描述.虽然任何一个伟大的数学家都不能轻易地被归到哪一类中去,但是,很清楚地,他们属于不同的传统.

当准备这个报告的时候,我想我应该写下我们目前这一代中能够继承这些传统的具有代表性的人的名字.谈论还健在的人是十分困难的——谁该放在这张名单上呢?接着我又暗自思忖:有谁会介意被放在这么一张著名的名单的哪一边呢?于是我选择了两个名字Arnold Bourbaki,前者是Poincaré-Newton传统的继承人,而后者,我认为,是Hilbert最著名的接班人.Arnold毫不含糊地认为:他的力学和物理的观点基本上是几何的,是源自于Newton的;以为存在处于二者之间的东西,除了象Riemann(他确实跟两者都有偏离)等少数人之外,都是一种误解.Bourbaki努力继续Hilbert的形式化的研究,将数学公理化和形式化推向了一个令人瞩目的范围并取得了一些成功.每一种观点都有它的优点,但是它们之间很难调和.

让我来解释一下我自己是如何看待几何和代数之间的不同.几何学当然讲的是空间,这是毫无疑问的.如果我面对这间房间里的听众,我可以在一秒中内或者是一微秒内看到很多,接收到大量的信息,当然这不是一件偶然的事件.我们大脑的构造与视觉有着极其重要的关系.我从一些从事神经生理学的朋友那里了解到,视觉占用了大脑皮层的百分之八十或九十.在大脑中大约有十七个中枢,每一个中枢专门用来负责视觉活动的不同部分:有些部分涉及的是垂直方向的,有些部分与水平方向有关,有些部分是关于色彩和透视的,最后有些部分涉及的是所见事物的具体含义和解说.理解并感知我们所看到的这个世界是我们人类发展进化的一个非常重要的部分.因此空间直觉(spatial intuition)或者空间知觉(spatial perception)是一种非常强有力的工具,也是几何学在数学上占有如此重要位置的原因,它不仅仅对那些明显具有几何性质的事物可以使用,甚至对那些没有明显几何性质的事物也可以使用.我们努力将它们归结为几何形式,因为这样可以让我们使用我们的直觉.我们的直觉是我们最有力的武器.特别是在向学生或是同事讲解一种数学时可以看得很清楚.当你讲解一个很长而且很有难度的论证,最后使学生明白了.学生这
时会说些什么呢?他会说“我看到了(我懂了)!”在这里看见与理解是同义词,而且我们还可以用“知觉”这个词来同时形容它们,至少这在英语里是对的,把这个现象与其他语言作对比同样有趣.我认为有一点是很基本的:人类通过这种巨大的能力和视觉的瞬间活动获取大量的信息,从而得以发展,而教学参与其中并使之完善.
在另一方面(也许有些人不这样认为),代数本质上涉及的是时间.无论现在做的是哪一类代数,都是一连串的运算被一个接着一个罗列出来,这里“一个接着一个”的意思是我们必须有时间的概念.在一个静态的宇宙中,我们无法想象代数,但几何的本质是静态的:我可以坐在这里观察,没有什么变化,但我仍可以继续观察.然而,代数与时间有关,这是因为我们有一连串的运算,这里当我谈到“代数”时,我并不单单指现代代数.任何算法,任何计算过程,都是一个接着一个地给出一连串步骤,现代计算机的发展使这一切看得很清楚.现代计算机用一系列0和1来反映其信息并由此给出问题的答案.

代数涉及的是时间的操作,而几何涉及的是空间.它们是世界互相垂直的两个方面,并且它们代表数学中两种不同的观念.因此在过去数学家们之间关于代数和几何相对重要性的争论或者对话代表了某些非常非常基本的事情.
当然只是为了论证是哪一边输了,哪一边胜利了,这并不值得.当我考虑这个问题时,有一个形象的类比:“你愿意成为一个代数学家还是一个几何学家?”这个问题就象问:“你愿意是聋子还是瞎子?”一样.如果人的眼睛盲了,就看不见空间;如果人的耳朵
聋了,就无法听见,听觉是发生在时间之中的,总的来说,我们还是宁愿二者都要.
在物理学,也有一个类似的、大致平行的关于物理概念和物理实验之间的划分.物理学有两个部分:理论——概念,想法,单词,定律——和实验仪器.我认为概念在某种广义的意义下是几何的,这是因为它们涉及的是发生在真实世界的事物.另一方面,实验更象一个代数计算.人们做事情总要花时间,测定一些数,将它们代入到公式中去.但是在实验背后的基本概念却是几何传统的一部分.

将上述二分叉现象用更哲学或者更文学的语言来说,那就是对几何学家而言,代数就是所谓的“浮士德的奉献”.正如大家所知道的,在歌德的故事里,浮士德通过魔鬼可以得到他所想要的(就是一个漂亮女人的爱),其代价是出卖他的灵魂,代数就是由魔鬼提供给数学家的供品.魔鬼会说:“我将给你这个有力的机器,它可以回答你的任何问题.你需要做的就是把你的灵魂给我:放弃几何,你就会拥有这个威力无穷的机器”(现在可以把它想象成为一台计算机!).当然我们希望同时拥有它们,我们也许可以欺骗魔鬼,假装我们出卖灵魂,但不真地给它.不过对我们灵魂的威胁依然存在,这是因为当我们转入代数计算时,本质上我们会停止思考,停止用几何的观念来考虑问题,不再思考其含义.

在这里我谈论代数学家的话重了一些,但是基本土,代数的目标总是想建立一个公式,把它放到一个机器中去,转动一下把手就可以得到答案.也就是拿来一个有意义的东西,把它化成一个公式,然后得到答案.在这样的一个过程中,人们不再需要思考代数的这些不同阶段对应的几何是什么.就这样,洞察力丢掉了,而这在那些不同的阶段都是非常重要的.我们绝不能放弃这些洞察力!最终我们还是要回到这上面来的,这就是我所谈到的浮士德的奉献.我肯定这种讲法尖锐了一点.
几何和代数的这种选择导致能融合二者的一些交叉课题的产生,并且代数和几何之间的区别也不象我讲的那样直截了当和朴实无华.例如,代数学家们经常使用图式(diagram).而除了几何直觉,图式又能是什么呢?
通用的技术

现在我不想再谈论太多就内容来划分的主题,而想谈谈那些依照已经使用的技术和常见方法所确定的主题,也就是我想描述一些已经广泛应用于众多领域的常见方法.第一个就是:
同调论
历史上同调论是作为拓扑学的一个分支而发展起来的.它涉及到以下情形.现有一个复杂的拓扑空间,我们想从中得到它的一些简单信息如计算它的洞或者类似事物的个数,得到某些与之联系的可加的线性不变量等.这是一种在非线性条件下关干线性不变量的构造.从几何的角度来看,闭链可加可减,这样就得到了所谓的一个空间的同调群.同调论,作为一种从拓扑空间获取某些信息的基本代数工具,是在本世纪上半叶发现的.这是一种从几何中获益匪浅的代数.
同调概念也出现在其他一些方面.其另一个源头可以追溯到Hilbert及其关于多项式的研究中,多项式是非线性的函数,它们相乘可以得到更高次数的多项式.正是Hilbert那伟大的洞察力促使他来讨论“理想”,具有公共零点的多项式的线性组合.他要寻找这些理想的生成元.生成元可能有很多.他审视它们之间的关系以及关系之间的关系.于是他得到这些关系的一个分层谱系,这就是所谓的“Hilbert合系”.Hilbert的这个理论是一种非常复杂的方法,他试图将一个非线性的情形(多项式的研究)化为线性情形.本质上来讲,Hilbert构造了一个线性关系的复杂体系.能够把象多项式这样的非线性事物的某些信息纳入其中.
这个代数理论实际上是与上述拓扑理论平行的,而且现在它们已融合在一起构成了所谓的“同调代数”.在代数几何学中,本世纪五十年代最伟大的成就之一是层的上同调理论的发展及在解析几何学中的扩展,这是由Leray,Cartan,Serre和Grothendieck等人组成的法国学派取得的.从中我们可以感受到一种既有Riemann-Poincaré的拓扑思想,又有Hilbert的代数思想,再加上某些分析手段的融合,
这表明同调论在代数的其它分支也有着广泛的应用.我们可以引入同调群的概念,它通常是与非线性事物相关的线性事物.我们可以将之应用于群论,例如,有限群,以及李代数:它们都有相应的同调群.在数论方面,同调群通过Galois群产生了非常重要的应用.因此在相当广泛的情形下同调论都是强有力的工具之一,它也是二十世纪数学的一个典型的特征.

K-理论

我要谈的另外一个技术就是所谓的“K-理论”.它在很多方面都与同调论相似,它的历史并不很长(直到二十世纪中叶才出现,尽管其起源的某些方面也许可以追溯到更早一些),但它却有着很广泛的应用,已经渗透进了数学的许多部分.K-理论实际上与表示理论紧密相联,有限群的表示理论,可以讲,起源于十九世纪.但是其现代形式——K-理论却只有一个相对较短的历史.K-理论可以用下面的方式来理解:它可以被想成是应用矩阵论的一种尝试.我们知道矩阵的乘法是不可交换的,于是我们想构造矩阵可换的或是线性的不变量.迹,维数和行列式都是矩阵论中可换的不变量,而K-理论即是试图处理它们的一种系统的方法,它有时也被称为“稳定线性代数”.其思想就是,如果我们有很多矩阵,那么把两个不可换的矩阵A和矩阵B放在不同块的正交位置上,它们就可换了,因为在一个大的空间里,我们可以随意移动物体.于是在某些近似情况下,这样做是很有好处的,足以让我们得到一些信息,这就是作为一个技术的K-理论的基石.这完全类似于同调论,二者都是从复杂的非线性情形获取线性的信息.
在代数几何中,K-理论是由Grothendieck首先引入的,并且取得了巨大的成功,这些与我们刚刚谈到的层理论密切相关,而且也和他在Riemann-Roch定理方面的工作有紧密联系.
在拓扑学方面,Hirzebruch和我照搬了这些思想并且将它们应用到一个纯粹的拓扑范畴内.从某种意义下来说,如果Grothendieck的工作与Hilbert在合系方面的工作有关,那么我们的工作更接近于Riemann-Poincaré在同调方面的工作,我们用的是连续函数,而他用的是多项式.K-理论也在椭圆算子的指标理论和线性分析的研究中起了重要作用.
从另外一个不同的角度,Milnor,Quillen和其他人发展了K-理论的代数方面,这在数论的研究中有着潜力巨大的应用.沿着这个方向的发展导致了许多有趣问题的产生.
在泛函分析方面,包括象Kasparov在内的许多人的工作将连续的K-理论推广到非交换的C*-代数情形.一个空间上的连续函数在函数乘积意义下形成一个交换代数.但是在其他情形下,自然地产生了类似的关于非交换情形的讨论,这时,泛函分析也就自然而然地成为了这些问题的温床.因此,K-理论是另外一个能够将相当广泛的数学的许多不同方面都能用这种比较简单的公式来处理的领域,尽管在每一个情形下,都有很多特定于该方面且能够连接其他部分的非常困难的,技巧性很强的问题.K-理论不是一个统一的工具,它更象是一个统一的框架,在不同部分之间具有类比和相似.
这个工作的许多内容已经被Alain Connes推广到“非交换微分几何”.
非常有趣的是,也就是在最近,Witten通过他在弦理论方面(基础物理学的最新思想)的工作发现许多很有趣的方法都与K-理论有关,并且K-理论看起来为那些所谓的“守恒量”提供了一个很自然的“家”.虽然在过去同调论被认为是这些理论的自然框架,但是现在看起来K一理论能提供更好的答案.

李群
另一个不单单是一项技术、而且是具有统一性的概念是李群.现在说起李群,我们基本上就是指正交群,酉群,辛群以及一些例外群,它们在二十世纪数学历史中起了非常重要的作用.它们同样起源于十九世纪.SophusLie是一位十九世纪的挪威数学家.正如很多人所讲的那样,他和Fleix Klein,还有其他人一起推动了“连续群理论”的发展.对 Klein而言,一开始,这是一种试图统一处理Euclid几何和非欧几何这两种不同类型几何的方法.虽然这个课题源于十九世纪,但真正起步却是在二十世纪,作为一种能够将许多不同问题归并于其中来研究的统一性框架,李群理论深深地影响了二十世纪.

我现在来谈谈Klein思想在几何方面的重要性.对于Klein而言,几何就是齐性空间,在那里,物体可以随意移动而保持形状不变,因此,它们是由一个相关的对称群来控制的.Euclid群给出Euclid几何而双曲几何源于另一个李群.于是每一个齐性几何对应一个不同的李群.但是到了后来,随着对Riemann的几何学工作的进一步发展,人们更关心那些不是齐性的几何,此时曲率随着位置的变化而变化,并且空间不再有整体对称性,然而,李群仍然起着重要的作用,这是因为在切空间中我们有Euclid坐标,以至于李群可以出现在一种无穷小的层面上.于是在切空间中,从无穷小的角度来看,李群又出现了,只不过由于要区分不同位置的不同点,我们需要用某种可以处理不同李群的方式来移动物体.这个理论是被Eile Cartan真正发展起来的,成为现代微分几何的基石,该理论框架对于Einstein的相对论也起着基本的作用.当然Einstein的理论极大地推动了微分几何的全面发展.
进入二十世纪,我前面提到的整体性质涉及到了在整体层面上的李群和微分几何.一个主要的发展是给出所谓的“示性类”的信息,这方面标志性的工作是由Borel和Hirzebruch给出的,示性类是拓扑不变量并且融合三个关键部分:李群,微分几何和拓扑,当然也包含与群本身有关的代数.

在更带分析味的方向上,我们得到了现在被称为非交换调和分析的理论.这是Fourier理论的推广,对于后者,Fourier级数或者是Fourier积分本质上对应于圆周和直线的交换李群,当我们用更为复杂的李群代替它们时,我们就可以得到一个非常漂亮、非常精巧
并且将李群表示理论和分析融为一体的理论.这本质上是Harish-Chandra一生的工作.

在数论方面,整个“Lang1ands纲领”,现在许多人都这样称呼它,紧密联系于Harish-Chandra理论,产生于李群理论之中.对于每一个李群,我们都可以给出相应的数论和在某种程度实施Langlands纲领.在本世纪后半叶,代数数论的一大批工作深受其影响.模形式的研究就是其中一个很好的例证,这还包括Andrew Wiles在Fermat大定理方面的工作.

也许有人认为李群只不过在几何范畴内特别重要而已,因为这是出于连续变量的需要.然而事实并非如此,有限域上的李群的类似讨论可以给出有限群,并且大多数有限群都是通过这种方式产生的.因此李群理论的一些技巧甚至可以被应用到有限域或者是局部域等一些离散情形中.这方面有许多纯代数的工作,例如与George Lusztig名字联系在一起的工作.在这些工作中,有限群的表示理论被加以讨论,并且我已经提到的许多技术在这里也可以找到它们的用武之地.

有限群

上述讨论已把我们带到有限群的话题,这也提醒了我:有限单群的分类是我必须承认的一项工作.许多年以前,也就是在有限单群分类恰要完成之时,我接受了一次采访,并且我还被问道我对有限单群分类的看法,我当时很轻率地说我并不认为它有那么重要.我的理由是有限单群分类的结果告诉我们,大多数单群都是我们已知的,还有就是一张有关若干例外情形的表.在某种意义下,这只不过是结束了一个领域.而并没有开创什么新东西,当事物用结束代替开始时,我不会感到很兴奋.但是我的许多在这一领域工作的朋友听到我这么讲,理所当然地会感到非常非常不高兴,我从那时起就不得不穿起“防弹衣”了.
在这项研究中,有一个可以弥补缺点的优点.我在这里实际上指的是在所有的所谓“散在群”(sporadic groups)中,最大的被赋予了“魔群”名字的那一个.我认为魔群的发现这件事本身就是有限单群分类中最叫人兴奋的结果了.可以看出魔群是一个极其有意思的动物而且现在还处于被了解之中.它与数学的许多分支的很大一部分有着意想不到的联系,如与椭圆模函数的联系,甚至与理论物理和量子场论都有联系.这是分类工作的一个有趣的副产品.正如我所说的,有限单群分类本身关上了大门,但是魔群又开启了一扇大门.
物理的影响
现在让我把话题转到一个不同的主题,即谈谈物理的影响.在整个历史中,物理与数学有着非常悠久的联系,并且大部分数学,例如微积分,就是为了解决物理中出现的问题而发展起来的.在二十世纪中叶,随着大多数纯数学在独立于物理学时仍取得了很好的发展,这种影响或联系也许变得不太明显.但是在本世纪最后四分之一的时间里,事情发生了戏剧性的变化,让我试着简单地评述一下物理学和数学,尤其是和几何的相互影响.
在十九世纪,Hamilton发展了经典力学,引入了现在称为Hamilton量的形式化.经典力学导出现在所谓的“辛几何”.这是几何的一个分支,虽然很早已经有人研究了,但是实际上直到最近二十年,这个课题才得到真正的研究.这已经是几何学非常丰富的一部分.几何学,我在这里使用这个词的意思是指,它有三个分支:Riemann几何,复几何和辛几何,并且分别对应三个不同类型的李群.辛几何是它们之中最新发展起来的,并且在某种意义下也许是最有趣的,当然也是与物理有极其紧密联系的一个,这主要因为它的历史起源与Hamilton力学有关以及近些年来它与量子力学的联系.现在,我前面提到过的、作为电磁学基本线性方程的Maxwell方程,是Hodge在调和形式方面工作和在代数几何中应用方面工作的源动力.这是一个非常富有成果的理论,并且自从本世纪三十年代以来已经成为几何学中的许多工作的基础.

我已经提到过广义相对论和Einstein的工作.量子力学当然更是提供了一个重要的实例.这不仅仅体现在对易关系上,而且更显著地体现在对Hilbert空间和谱理论的强调上.
以一种更具体和明显的方式,结晶学的古典形式是与晶体结构的对称性有关的.第一个被研究的实例是发生在点周围的有限对称群,这是鉴于它们在结晶学中的应用.在本世纪中,群论更深刻的应用已经转向与物理的关系,被假设用来构成物质的基本粒子看起来在最小的层面上有隐藏的对称性,在这个层面上,有某些李群在此出没,对此我们看不见,但是当我们研究粒子的实际行为时,它们的对称性就显现无遗了.所以我们假定了一个模型,在这个模型当中,对称性是一个本质性的要素,而且目前那些很普遍的不同理论都有一些象SU(2)和SU(3)那样的基本李群融入其中并构成基础的对称群,因此这些李群看起来象是建设物质大厦的砖石.
并不是只有紧李群才出现在物理中,一些非紧李群也出现在物理中,例如Lorentz群.正是由物理学家第一个开始研究非紧李群的表示理论的.它们是那些能够发生在Hilbert空间的表示,这是因为,对于紧群而言,所有不可约表示都是有限维的,而非紧群需要的是无穷维表示,这也是首先由物理学家意识到的.
在二十世纪的最后25年里,正如我刚刚完成阐述的,有一种巨大的从物理学的新思想到数学的渗透,这也许是整个世纪最引人注目的事件之一,就这个问题本身,也许就需要一个完整的报告,但是,基本上来讲,量子场论和弦理论已经以引人注目的方式影响了数学的许多分支,得到了众多的新结果、新思想和新技术.这里,我的意思是指物理学家通过对物理理论的理解已经能够预言某些在数学上是对的事情了.当然,这不是一个精确的证明,但是确有非常强有力的直觉、一些特例和类比所支持.数学家们经常来检验这些由物理学家预言的结果,并且发现它们基本上是正确的,尽管给出证明是很困难的而且它们中的许多还没有被完全证明.
所以说沿着这个方向,在过去的25年里取得了巨大的成果.这些结果是极其细致的.这并不象物理学家所讲的“这是一种应该是对的东西”.他们说:“这里有明确的公式,还有头十个实例(涉及超过12位的数字)”.他们会给出关于复杂问题的准确答案,这些决不是那种靠猜测就能得到的,而是需要用机器计算的东西,量子场论提供了一个重要的工具,虽然从数学上来理解很困难,但是站在应用的角度,它有意想不到的回报.这是最近25年中真正令人兴奋的事件.
在这里我列一些重要的成果:SimonDona1dson在四维流形方面的工作;Vaughan-Jones在扭结不变量方面的工作;镜面对称,量子群;再加上我刚才提到的“魔群”
这个主题到底讲的是什么呢?正如我在前面提到过的一样,二十世纪见证了维数的一种转换并且以转换为无穷维而告终,物理学家超越了这些,在量子场论方面,他们真正试图对广泛的无穷维空间进行细致的研究,他们处理的无穷维空间是各类典型的函数空间,它们非常复杂,不仅是因为它们是无穷维的,而且它们有复杂的代数、几何以及拓扑,还有围绕其中的很大的李群,即无穷维的李群,因此正如二十世纪数学的大部分涉及的是几何、拓扑、代数以及有限维李群和流形上分析的发展,这部分物理涉及了在无穷维情形下的类似处理.当然,这是一件非常不同的事情,但确有巨大的成功.

让我更详尽地解释一下,量子场论存在于空间和时间中.空间的真正的意义是三维的,但是有简化的模型使我们将空间取成一维.在一维空间和一维时间里,物理学家遇到的典型事物,用数学语言来讲,就是由圆周的微分同胚构成的群或者是由从圆周到一个紧李群的微分映射构成的群.它们是出现在这些维数里的量子场论中的两个非常基本的无穷维李群的例子,它们也是理所当然的数学事物并且已经被数学家们研究了一段时间.
在这样一个1+1维理论中,我们将时空取成一个Riemann曲面并且由此可以得到很多新的结果.例如,研究一个给定亏格数的Riemann曲面的模空间是个可以追溯到上个世纪的古典课题.而由量子场论已经得到了很多关于这些模空间的上同调的新结果.另一个非
常类似的模空间是一个具有亏格数g的Riemann曲面上的平坦G-丛的模空间.这些空间都是非常有趣的并且量子场论给出关于它们的一些精确结果.特别地,可以得到一些关于体积的很漂亮的公式,这其中涉及到Zeta函数的取值.

另一个应用与计数曲线(counting curve)有关.如果我们来看给定次数和类型的平面代数曲线,我们想要知道的是,例如,经过那么多点究竟有多少曲线,这样我们就要面临代数几何的计数问题,这些问题在上个世纪一直是很经典的.而且也是非常困难的.现在它们已经通过被称为“量子上同调”的现代技术解决了,这完全是从量子场论中得到的.或者我们也可以接触那些关于不在平面上而在弯曲族上的曲线的更加困难的问题,这样我们得到了另一个具有明确结果的被称为镜面对称的美妙理论,所有这些都产生于1+1维量子场论.
如果我们升高一个维数,也就是2-维空间和1-维时间,就可以得到Vaughan-Jones的扭结不变量理论.这个理论已经用量子场论的术语给予了很美妙的解释和分析.
量子场论另一个结果是所谓的“量子群”.现在关于量子群的最好的东西是它们的名字.明确地讲它们不是群!如果有人要问我一个量子群的定义,我也许需要用半个小时来解释,它们是复杂的事物,但毫无疑问它们与量子理论有着很深的联系它们源于物理,而且现在的应用者是那些脚踏实地的代数学家们,他们实际上用它们进行确定的计算.
如果我们将维数升得更高一些,到一个全四维理论(三加一维),这就是Donaldson的四维流形理论,在这里量子场论产生了重大影响.特别地,这还导致Seiberg和Witten建立了他们相应的理论,该理论建立在物理直觉之上并且也给出许多非同寻常的数学结果.所有这些都是些突出的例子.其实还有更多的例子.
接下来是弦理论并且这已经是过时的了!我们现在所谈论的是M一理论,这是一个内容丰富的理论,其中同样有大量的数学,从关于它的研究中得到的结果仍有待于进一步消化并且足可以让数学家们忙上相当长的时间.

历史的总结
我现在作一个简短的总结.让我概括地谈谈历史:数学究竟发生了什么?我相当随意地把十八世纪和十九世纪放在了一起,把它们当做我们称为古典数学的时代,这个时代是与Euler和Gauss这样的人联系在一起的,所有伟大的古典数学结果也都是在这个时代被发
现和发展的.有人也许认为那几乎就是数学的终结了,但是相反地,二十世纪实际上非常富有成果,这也是我一直在谈论的.
二十世纪大致可以一分为二地分成两部分.我认为二十世纪前半叶是被我称为“专门化的时代”,这是一个Hilbert的处理办法大行其道的时代,即努力进行形式化,仔细地定义各种事物,并在每一个领域中贯彻始终.正如我说到过的,Bourbaki的名字是与这种趋势联系在一起的.在这种趋势下,人们把注意力都集中于在特定的时期从特定的代数系统或者其它系统能获得什么.二十世纪后半叶更多地被我称为“统一的时代”,在这个时代,各个领域的界限被打破了,各种技术可以从一个领域应用到另外一个领域,并且事物在很大程度上变得越来越有交叉性.我想这是一种过于简单的说法,但是我认为这简单总结了我们所看到的二十世纪数学的一些方面.

二十一世纪会是什么呢?我已经说过,二十一世纪是量子数学的时代,或者,如果大家喜欢,可称为是无穷维数学的时代.这意味着什么呢?量子数学的含义是指我们能够恰当地理解分析、几何、拓扑和各式各样的非线性函数空间的代数,在这里,“恰当地理解”,我是指能够以某种方式对那些物理学家们已经推断出来的美妙事物给出较精确的证明.

有人要说,如果用天真幼稚的方式(naive way)来研究无穷维并问一些天真幼稚的问题,通常来讲,只能得到错误的答案或者答案是无意义的,物理的应用、洞察力和动机使得物理学家能够问一些关于无穷维的明智的问题,并且可以在有合乎情理的答案时作一些非常细致的工作,因此用这种方式分析无穷维决不是一件轻而易举的事情.我们必须沿着这条正确的道路走下去.我们已经得到了许多线索,地图已经摊开了:我们的目标已经有了,只不过还有很长的路要走.

还有什么会发生在二十一世纪?我想强调一下Connes的非交换微分几何.Alain Connes拥有这个相当宏伟的统一理论.同样,它融合了一切.它融合了分析、代数、几何、拓扑、物理、数论,所有这一切都是它的一部分.这是一个框架性理论,它能够让我们在非交换分析的范畴里从事微分几何学家通常所做的工作,这当中包括与拓扑的关系.要求这样做是有很好的理由的,因为它在数论、几何、离散群等等以及在物理中都有(潜力巨大的或者特别的)应用.一个与物理有趣的联系也刚刚被发现.这个理论能够走多远,能够得到什么结果,还有待进一步观察.它理所当然地是我所期望的至少在下个世纪头十年能够得到显著发展的课题,而且找到它与尚不成熟的(精确)量子场论之间的联系是完全有可能的.
我们转到另一个方面,也就是所谓的“算术几何”或者是Arakelov几何,其试图尽可能多地将代数几何和数论的部分内容统一起来.这是一个非常成功的理论.它已经有了一个美好的开端,但仍有很长的路要走.这又有谁知道呢?
当然,所有这些都有一些共同点.我期待物理学能够将它的影响遍及所有地方,甚至是数论:Andrew Wiles不同意我这样说,只有时间会说明一切.
这些是我所能看到的在下个十年里出现的几个方面,但也有一些难以捉摸的东西:返回至低维几何.与所有无穷维的富有想象的事物在一起,低维几何的处境有些尴尬.从很多方面来看,我们开始时讨论的维数,或我们祖先开始时的维数,仍留下某些未解之谜.维数为2,3和4的对象被我们称为“低”维的.例如Thurston在三维几何的工作,目标就是能够给出一个三维流形上的几何分类,这比二维理论要深刻得多.Thurston纲领还远远没有完成,完成这个纲领当然将是一个重要的挑战.
在三维中另外一个引人注目的事件是Vaughan-Jones那些思想本质上来源于物理的工作.这给了我们更多的关于三维的信息,并且它们几乎完全不在Thurston纲领包含的信息之内.如何将这两个方面联系起来仍然是一个巨大的挑战,但是最近得到的结果暗示两者之间可能有一座桥,因此,整个低维的领域都与物理有关,但是其中实在有太多让人琢磨不透的东西.

最后,我要提一下的是在物理学中出现的非常重要的“对偶”.这些对偶,泛泛地来讲,产生于一个量子理论被看成一个经典理论时有两种不同的实现.一个简单的例子是经典力学中的位置和动量的对偶.这样由对偶空间代替了原空间,并且在线性理论中,对偶就是Fourier变换.但是在非线性理论中,如何来代替Fourier变换是巨大的挑战之一.数学的大部分都与如何在非线性情形下推广对偶有关.物理学家看起来能够在他们的弦理论和M一理论中以一种非同寻常的方式做到了这一点.他们构造了一个又一个令人叹为观止的对偶实例,在某种广义的意义下,它们是Fourier变换的无穷维非线性体现,并且看起来它们能解决问题,然而理解这些非线性对偶性看起来也是下个世纪的巨大挑战之一.

我想我就谈到这里.这里还有大量的工作,并且我觉得象我这样的一个老人可以和你们这么多的年轻人谈谈是一件非常好的事情;而且我也可以对你们说:在下个世纪,有大量的工作在等着你们去完成.
小站头像RSS归档

站长

  • 陈成
149人关注

站长在关注

  • 大榕树洞里的老灵魂
  • 人人小站
  • 天空与望远镜
  • 辛几何&李代数
  • 养生之道
  • 量子场论
  •   小站活动
  • 数学的美学世界
  • 音乐时光
  • 理论物理
  • 从前有个数
  • cosmo
  • 宇宙的心弦
  • 小站精选

No comments:

Post a Comment