Sunday, January 25, 2015

brain 相空间中的点的绝对大的体积对应于热平衡;该体积中的点描述和热平衡一致的个别粒子位置和速度的所有不同的细致形态。这个巨大的体积是我们在相空间中的一个(很容易是)最大的区域,实际上它几乎占据了整个相空间!

相空间中的点的绝对大的体积对应于热平衡;该体积中的点描述和热平衡一致的个别粒子位置和速度的所有不同的细致形态。这个巨大的体积是我们在相空间中的一个(很容易是)最大的区域,实际上它几乎占据了整个相空间!


相空间


 
 
  哈密顿方程的形式允许我们以一种非常强而有力的一般方式去“摹想”经典系统的演化。想象一个多维“空间”,每一维对应于一个座标x1,x2,…p1p2,…(数学空间的维数,通常比3大得多。)此空间称之为相空间(见图5.10)。对于n个无约束的粒子。相空间就有6n维(每个粒子有三个位置座标和三个动量座标)。读者或许会担心,甚至只要有一个单独粒子,其维数就是他或她通常所能摹想的二倍!不必为此沮丧!尽管六维的确是比能明了画出的更多的维数,但是即使我们真的把它画出也无太多用处。仅仅就一满屋子的气体,其相空间的维数大约就有
  10 000 000 000 000000000000 000 000
  去准确地摹想这么大的空间是没有什么希望的!既然这样,秘诀是甚至对于一个粒子的相空间都不企图去这样做

第五章经典世界 - xian.name

xian.name/cn/readers/03/835.htm 轉為繁體網頁
第五章经典世界. 物理理论的状况. 为了了解意识如何是自然的一部分,我们对自然的运行要知道哪些呢?制约身体和头脑组成基元的定律与此关系重大吗?如果真的 ...
  • 皇帝新脑:有关电脑、人脑及物理定律_百度百科

    baike.baidu.com/view/9650401.htm 轉為繁體網頁
    孟德勒伯洛特集是递归的吗. 一些非递归数学的例子. 孟德勒伯洛特集像非递归数学吗. 复杂性理论. 物理事物中的复杂性和可计算性. 第五章经典世界. 物理理论的状况.

  • 這是 Google 對 http://xian.name/cn/readers/03/837.htm 的快取。 這是該網頁於 2015年1月17日 04:32:00 GMT 顯示時的快照。 在此期間,目前網頁可能已經變更。 瞭解更多資訊
    提示:如要在這個網頁上快速尋找您所搜尋的字詞,請按下 Ctrl+F 鍵或 ⌘-F 鍵 (Mac),然後使用尋找列進行搜尋。

     
    第七章 宇宙论和时间箭头
    二先网
    English                      chinese
      115年1月25日 星期日
     
    主页物理读物心理控制期货策略醉放作品关于本站


     
    第七章 宇宙论和时间箭头
     
    时间的流逝
     
      体验时间进展的感觉是我们知觉的中心。我们似乎从确定的过去向未定的将来不断前进。我们觉得过去的已经完结了,它是不可改变的,它在某种意义上还在“那里”。我们现在关于它的知识来自于我们的记录、我们记忆的痕迹以及从这些推导而来的东西。但是,我们从未怀疑过去的“实在性”。过去的那个样子也只能是这样了。发生过的事情已经发生过了,不管是我们还是任何人做任何事情都无法改变它!另一方面,将来似乎还是未定的。它可以这样也可以那样。或许这种“选择”完全是由物理定律所决定,或许一部分由我们自己(或上帝)所决定;但是似乎这种“选择”仍然有待于进行。它似乎仅仅是任何未来的“实在”都可以在实际上归结于它的潜势力。当我们有意识地感觉到时间的流逝时,广漠而表面上不确定的将来的最急切部分连续地变成为现实,并因此进入僵死的过去。有时我们会感到,我们甚至对特殊潜在的未来选择的某种影响独自“负责”,这种选择事实上已被实现,并成为过去的永恒实在。我们更经常觉得,当确定的过去疆域无情地吞噬未定的将来时,自身只是一个无助的旁观者--也许还要庆幸自己对这一切不必负责任。   但是,正如我们所知道的,物理告诉我们的却是另一回事。所有成功的物理方程都在时间上是对称的。它们在时间的任何方向上使用都显得一样。在物理学上,将来和过去似乎是平权的。牛顿定律、哈密顿方程、马克斯韦方程、爱因斯坦广义相对论、狄拉克方程、薛定谔方程--如果我们颠倒时间方向(用-t来取代代表时间的座标t),所有这些方程在实质上都不变。全部经典力学以及量子力学U部分都是完全时间可逆的。现在存在一个问题,量子力学R部分在实际上是否时间可逆的。这个问题将是下一章论证的中心。此刻,让我们首先避开这个问题,并把它当作这个课题的“传统智慧”,也就是不管其初看起来怎样,R的动作也应该被认为是时间对称的(参阅阿哈拉诺夫,柏格曼和列波维奇1964)。如果我们接受这些,似乎就必须环视四周,看看是否在它处能找到物理定律断言的过去和将来的差别之所在。
      我们研究这个问题之前,必须考虑在我们时间感觉和现代物理理论教导我们相信的之间另一个令人困惑的偏离。根据相对论,根本就没有什么叫做“现在”的东西。我们所能得到和这最接近的概念是(正如在229页的图5.21所示的)观察者在空间��时间中的同时空间,但是它依赖于观察者的运动!一个观察者的“现在”和另一观察者的不同1。关于空间��时间中的两个事件AB,第一位观察者U会认为B属于固定的过去,而A属于未定的将来;而对于第二观察者V可变为A属于固定的过去,而B属于未定的将来!(见图7.1)。只要AB中的任何一个事件是确定的,我们就不能完全有意义地断言另一个事件是否仍是未定的。
      回想一下230页的讨论以及图5.22。两人在路上相遇。按照其中一人,仙女座大星云空间舰队已经启程,而另一人却认为,还没有决定是否实际进行这次航行。那个已经决定的结果怎么还会有某种不确定呢?如果对于其中一个人而言决定已做出,那很清楚能再有任何非确定性。空间舰队的启程已是不可避免。事实上他们中没有任何一个人知道空间舰队的发射。他们将来只能在地球上的望远镜观测揭示了舰队的确已在航程中时才知道。然后,他们可以回到原先邂逅之处2,并且得出结论道,在那个时刻,按照其中一人,这个决定于未定的将来才做,而对于另一人,决定已在固定的过去做过。那时关于未来是否确有任何未定之处?或者是否两人的未来已被“固定了”?
      情况似乎变成,如果任何事情完全确定,则整个空间--时间应该的的确确是确定的!不可能有“未确定的”未来。整个空间--时间必须是固定的,没有任何不确定的疆域。的确,这似乎正是爱因斯坦自己的结论(参阅派斯1982444页)。此外,根本就没有时间流逝。我们只有“空间--时间”--并且根本就没有正在被确定的过去无情侵占的未来疆域!(读者也许会诧异量子力学的“不确定性”在所有这些中扮演什么角色。我将在下一章回到量子力学引起的这一问题。此刻,最好只按照纯粹经典的图像来思考这一切。)
      依我看来,在我们关于时间流逝的意识感觉和我们关于物理世界的实在的(超等精密的)理论所作的断言之间存在着严重的偏离。假定(正如我所相信的)知觉的更基础的某种东西一定能在和某种物理的关系中得到理解的话,则这些偏离必须在实际上告诉我们这种物理的一些深刻的内容。看来不管什么物理在起作用,它至少必须有一根本的时间反对称要素,也就是说它应该能把过去和将来区分开来。
      如果物理的定律不能区分将来和过去--并且甚至连“现在”这个概念和相对论都不能和谐相处��那么究竟何处可以寻找到和我们自以为理解世界的方式更一致的物理定律呢?事实上,事情并非像我似乎要表明的那样具有这样大的偏离。我们的物理理解除了仅仅是时间演化的方程以外,还包含有牵涉到时间不对称的重要部分。其中最重要的是热力学第二定律。我们先要对这一个定律有所了解。
     
    熵的无情增加
     
      想象把一杯水放在桌子的边缘上。稍微推一下就会落到地面上去--无疑地会被打碎成许多碎片,水会溅到相当大的面积上,或许会被地毯吸收,还会流到地板的缝隙中去。我们这一杯水在这里只不过忠实地遵循着物理的方程罢了。牛顿的描述即已足够。杯子和水中的原子独立地遵守牛顿定律(图7.2)。现在让我们把这图像在时间的相反方向表演。由于这些定律的时间可逆性,这些水可以一样容易地从地毯和地板缝隙中流出,流进一个从许多碎片拼凑而成的玻璃杯中,这整体从地板上刚好跳跃到桌子的高度,然后停在它的边缘上。正如杯子落下打碎的过程一样,所有这一切又都和牛顿定律相符合。
     
    读者也许会问使杯子从地板上升到桌子上去的能量从何而来。没有问题。不可能有能量的问题,因为在杯子从桌子落下时,从下落得到的能量必须跑到某处去。下落杯子的能量事实上变成热。在杯子摔到地面的时刻,杯子碎片、水、地毯和地板的原子会以一种比以前更快一些的杂乱的方式运动。也就是说,玻璃片、水、地毯和地板会比这发生之前仅仅变得稍一些(不管蒸发引起的可能的热丧失��但是在原则上,那也是可逆的)。由于能量守恒,这热刚好等于这杯水从桌子上落下时的能量损失。所以,这些热能也刚好是足以使玻璃杯重新举到桌子上的能量!注意,在我们考虑能量守恒时把热能也计入是很重要的。把热能也包括进去的能量守恒定律称为热力学第一定律。由牛顿力学推导而来的热力学第一定律是时间对称的。第一定律并不以任何方式限制玻璃和水,从而排除碎片聚集成杯子,并且充满水后奇迹般地跳回到桌面上的可能性。
      我们从未看到这类事情发生的原因是,在玻璃碎片、水、地板和地毯中的原子的“热”运动全是极其紊乱的,所以大部分原子都在错误的方向上运动。为了聚集玻璃碎片并收回所有溅开的水,而且最后优美地跳回到桌子上,必须以不可思议的精确度把它们的运动协调起来。可以肯定的是,这样协同的运动实际上是不存在的!只有极其侥幸地,也就是如果真有这样的“魔术”发生的话,才会有这种协同。
      然而沿着时间的另一方向,这种协同运动则是司空见惯的。假定在物理状态的某种大尺度变化发生(这里是玻璃杯被打碎,水流走)之后而不是之前,粒子以协同的方式运动,我们并不把这些认为是侥幸。在此事件以后,粒子的运动的存在必须是高度协同的;由于这些运动具有这类性质,所以如果我们以完全精确的方式去颠倒每一个别原子的运动,则结果正是集中碎片,充满水并把水杯刚好举到出发之处所需要的行为。
      把高度协调一致的运动看作大尺度变化的效应而不看作原因的观点是可以接受的并且是熟悉的。然而“原因”和“效应”两词需要面对时间反对称的问题。通俗地讲,我们已习惯于在原因必须先于效应的意义上应用这些术语。但是要想理解在过去和将来之间物理上的不同,就必须非常警惕不让我们日常的关于过去和将来的感觉无意识地注入到讨论中去。我必须警告读者,要避免这样是极其困难的,但是我们必须强制自己这样做。我们必须尽力地这样使用词句,即在过去和将来的物理差异上不偏不倚。相应地,如果情势被认为刚好是合适的,我们就必定允许自己把事件的原因放在将来,而把效应放到过去!经典物理的决定性的方程(或量子物理的U过程)对于未来方向的演化并没有什么特权。它们可以一样好地适用于向过去方向的演化。未来之决定过去犹如过去之决定未来。我们可以用某种任意的方式指明系统在将来的某一个状态,并用之来计算过去应该是什么样子的。如果我们允许在时间的正常未来方向演化方程时,把过去当作“原因”,而把将来当作“效应”;则在时间的过去方向上,我们就可以应用演化方程的同等有效的步骤,并且显然地应该把将来当作“原因”,而把过去当作“效应”。
      然而,在我们使用“原因”和“效应”的术语时牵涉到其他的某些东西,这根本就不是哪个事件发生在过去、哪个发生在将来的问题。让我们想象一个假想的宇宙,而且我们自己宇宙中的时间对称的同样的经典方程可适用于它。但是,在这宇宙中人们熟悉的行为(例如,一个玻璃杯被打碎,水流走)和这些行为的时间反演的发生共存。随同我们比较熟悉的经验,假定有时玻璃碎片真的聚集起来,神秘地充满了流走的水,然后又跳回到桌上去;还假定,有时搅伴煮熟的鸡蛋魔术般地恢复回来并最后飞回到打碎的蛋壳里,蛋壳完好地聚集起来,并把它新得到的内容封好;从溶解在甜咖啡中的糖会形成一块方糖,并自动地从杯子里跳回到某人手中。如果我们生活在这类事为司空见惯的世界中,我们肯定不会把这类事件的“原因”归结成奇异的有关单独原子的相关行为的不可能的机遇,而是认为是某种“目的论效应”。由于这种效应,自装配的物体有时力求得到所需要的某种宏观的结构。“看!”我们会说,“它正在重新发生。那团乱七八糟的东西正把自己聚集成另一杯水!”我们会毫无疑问地认为,原子的目标是如此之精确,因为这是产生桌子上的一杯水的方式。桌子上的杯子变成“原因”而地面上显得杂乱的一团原子是“效应”--尽管这个“效应”在时间上比“原因”发生得更早。类似地,在搅拌煮熟的鸡蛋中的原子的精细组织的运动不是向聚集的鸡蛋壳跳回的“原因”,而是未来所发生的“效应”;糖块不是“因为”原子以非凡的精度运动,而是由于某个人--显然是在将来&--要把糖块抓到手里,所以才集合起来并从杯子里跳出来!
      当然,在我们的世界中看不到这类事的发生--或者可以更好地表达成,我们没看到这些事和那些正常类型的事共存。如果所有我们看到的都和上述的那样反常,则我们不会有任何问题。只要在我们所有的描述中把“过去”和“将来”,“以前”和“以后”等等术语互相交换一下就可以了。可以认为时间沿着和原先认定的相反的方向前进,那个世界就可描述成和我们自己的世界一样。然而,我在这里摹想另一种不同的可能性--水杯的破碎和聚集能共存。在这样的世界中,我们不能仅仅靠改变时间进展的方向的习惯方法来恢复我们所熟悉的描述。当然,我们的世界刚好不是那样子,为何不是那样子?为了着手理解此事实,我要求你尝试想象这样的一个世界,并惊异我们会如何描述其中发生的事情。我要求你接受,在这样的一个世界中,我们一定能把粗糙的宏观的东西--诸如一满杯水,没有碎的蛋,手中的方糖--描述成提供的“原因”,而将详细的、或有精密关联的个别原子运动当作“效应”,而不管“原因”是否处于效应的将来或过去。
      为何在刚好我们生活其中的世界中,在实际上原因总是超前于效应;或换一种讲法,为何准确协同的粒子运动总是在某种物态的大尺度变化之后而不是之前呢?为了对这类事物有更好的描述,我必须引进的概念。粗略地讲,系统的是其呈现的无序的量度。(以后我会表达得更精确一些。)这样,碎玻璃杯和地板上溅开的水,是比桌子上完好的一满杯水具有更高的的态;搅拌的鸡蛋比新鲜的未打碎的蛋具有更高的;甜咖啡比淡咖啡以及未溶解的糖块的更大。低态似乎是某种以明显的方式“被特别地安排好”,而高态却没有那么“被特别地安排”。
      当我们谈到低态的“特殊性”时,很重要的一点是要意识到,我们指的是显明的特殊性。因为,在一个更微妙的意义上,这些情形下的高态,由于个别粒子运动的非常精密的协调,正和态一样地是“被特别地安排的”。例如,在打碎杯子后流到地板缝隙中的水分子的似乎随机的运动其实是非常特殊的:其运动是如此之精密,如果它们所有都刚好颠倒过来,则原先的低态也就是桌子上的完好的、装满水的杯子就会被恢复。(情况必定如此,由于所有这些运动的反演刚好简单地对应于时间方向的反转--依此杯子会聚集好,并跳回到桌子上去。)但是,所有水分子的这种协调的运动并非我们称为低的那种“特殊性”。是指显明的无序性。存在于粒子运动的精确的协同的有序不是显明的有序,故不能用以降低系统的。所以,流出的水中的分子的有序性在这种方式中不能算数,它的是高的。然而,在完好的一杯水的显明的有序给出了低的值。这里表明的是这样的一个事实,即粒子运动只有少数几个可能的形态和一个完好装满水的杯子的显明形态相一致;相对来说,有更多得多的运动与地板缝中稍微加热的流水的显明形态相一致。
    热力学第二定律断言孤立系统的熵随时间增加(或对于一个可逆的系统保持常数)。我们不能把协同的粒子的运动当作低。如果算的话,根据此定义,系统的“”就会永远是常数。概念只能指的确是显明的无序性。对于一个和宇宙的其余部份隔离开的系统,它的总增加。所以,如果它从某种显明的组织好的状态出发的话,该组织在过程中就会被腐蚀,而这些显明的特征就转化成“无用的”协同的粒子运动。第二定律似乎是一椿绝望的裁决,因为它断言存在一个无情和普遍的物理原则,它告诉我们组织总是被不断地损坏。我们将来会看到,这个悲观的结论并非完全合适!
     
    什么是熵?
     
      但是精确地讲,物理系统的什么呢?我们看到了它是显明无序的某种测度。但是,由于我这样不精密地使用诸如“显明”和“无序”的字眼,的概念实在还算不上一个清晰的物理量。第二定律还有另一方面似乎表明概念中的不精确的因素:只有所谓的不可逆的系统才实际上增加,而不仅仅是保持常数。“不可逆”是什么含义呢?如果计入所有粒子的细节运动,则所有系统都是可逆的!我们应该讲,在实际上杯子从桌子落下并粉碎,鸡蛋的搅拌,或糖在咖啡中的溶解都是不可逆的;而少数粒子的互相反弹,还有许多能量没有损耗变成热的各种仔细控制的情形是可逆的。基本上讲,“不可逆”这一个术语只是指这样的一个事实,即不可能去追踪或控制系统中的所有个别粒子运动的所有细节。这些不可控制的运动被叫做“热”。这样,不可逆性似乎只是一个“实用的”东西。虽然按照力学定律我们完全允许去恢复鸡蛋,但在原则上这是不可能的。难道我们的概念要依赖于什么是可行的,什么是不可行的吗?
      我们记得在第五章中,能量以及动量和角动量的物理概念可以按照粒子的位置、速度、质量和力在数学上被精确地定义。我们怎能期望“显明无序性”的概念也做到一样好,使之成为一个数学上精确的概念呢?显然,对于一个观察者“显明”并不表明对另一个观察者亦是如此。它是否取决于每位观察者对被观察系统的测量精度呢?一个观察者用一台更好的测量仪也许能比另一个观察者得到关于系统微观结构的更细致的信息。系统中更多的“隐藏的有序”也许对一个观察者是显明的,对另一个观察者却是另外一回事。相应地,前者会断言比后者估算的要低。不同观察者的美学判断似乎也会被牵涉到那些被定为“有序”而不是“无序”的东西。我们可以想象,有些艺术家的观点认为一堆破碎的玻璃片远比曾经待在桌子的边缘上丑陋吓人的杯子更为美丽有序!是否会在这种具有艺术感觉的观察者的判断那里被降低呢?
      尽管这些主观性的问题,使人惊异的是,在精密的科学描述中概念是极其有用的。这一点是无疑的。这么有用的原因在于,一个系统按照细致的粒子位置和速度从有序向无序的转变是极其巨大的,并且(在几乎所有的情况下)完全把在宏观尺度上关于何为“显明有序”的观点的任何合理的差别完全淹没。特别是艺术家或科学家关于聚集或破碎的玻璃哪种更有序的判断,以的测度来考察,则几乎毫无结果。迄今为止对于的主要贡献来自于引起温度微小增加的随机的粒子运动,水的溅开以及一杯水落到地面上去等等。
      为了更精密地定义的概念,让我们回到第五章引进的相空间的观念。我们记得,系统的相空间通常具有极大的维数,其中每一点代表了包括系统的所有细节的整个物理态。相空间的一个单独的点提供了构成该物理系统的每一个单独粒子的位置和动量座标。为了的概念,我们需要用一种办法把从其显明(也即宏观)性质看起来一样的所有的态集中起来。这样,我们必须把我们的相空间分成一些区域(参见图7.3)。属于任何特别区域的不同点虽然代表它们粒子的位置和运动的不同细节,但是对于宏观的观察特征而言,仍然认为是一样的物理系统。从什么是显明的观点看,一个单独区域中的所有点应被考虑作相同的物理系统。相空间这样地被划分成区域的作法被称为相空间的粗粒化
     
    现在,这些区域中的一些会比其他的区域庞大得多。例如,考虑一盒气体的相空间。相空间的大部分体积对应于气体非常均匀地在盒子中分布的态,粒子以一种能提供均匀温度和压力的特征的方式运动。这种运动的特别方式,在某种意义上可能是称之为马克斯韦分布的最“紊乱的”一种,它是以我们前面遇到的同一位詹姆斯·克拉克·马克斯韦来命名的:气体处于这种紊乱状态时就说它达到了热平衡。相空间中的点的绝对大的体积对应于热平衡;该体积中的点描述和热平衡一致的个别粒子位置和速度的所有不同的细致形态。这个巨大的体积是我们在相空间中的一个(很容易是)最大的区域,实际上它几乎占据了整个相空间!让我们考虑气体的另一种可能的态,譬如所有的气体被局限在盒子的一个角落上。又存在许多不同的个别粒子的细致的态,它们都描述以同样的方式把气体局限在盒子角落的宏观态。所有这些在宏观上都不能互相区别,而相空间中代表它们的点构成了相空间的另一个区域。然而,这一个区域体积比代表热平衡的那个区域要小得多了。如果我们的盒子的体积为一立方米,装有在通常大气压和温度下的平衡的气体,而角落区域的体积取作一立方厘米,则上面

      为了评价这类相空间体积之间的差异,想象一种简化的情形,即把许多球分配到几个方格中去。假如每一方格或者是空的或者只容纳一个球。用球来代表气体分子而方格表示分子在盒子里所占据的位置。让我们从所有方格中挑出特殊的小子集;这些被用于代表对应于盒子的一个角落的区域的气体分子位置。为明确起见,假定刚好有十分之一数目的方格为特殊的--譬如讲有n个特殊的方格和9n个非特殊的方格(见图7.4)。我们希望把m个球随机地分配到这些方格中去,并且求出所有的球都落到特殊方格中去的机会。如果只有一个球和十个方格(这样我们只有一个特殊方格),则很清楚,机会应为十分之一。如果只有一个球,但有任意数目10n的方格(这样我们就有n个特殊方格),则情况不变。这样就对于仅有一个原子的“气体”,把气体局限在那个角落的区域,就具有整个“相空间”体积的十分之一。倘若我们增加球的数目,所有它们都在特殊方格中的机会就非常显著地减少。对于两个球,譬如讲二十个方格(其中两个是特殊的)(m=2n=2),机会为1/190,或者对于一百个方格(其中十个是特殊的)(m=2n=10),机会为1/110;对于数量非常大的方格机会变成1/100。这样,对于两个原子“气体”特殊区域的体积仅为整个“相空间”的百分之一。对于球和三十个方格(m=3n=3),机会为1/4060;而对于数量非常大的方格,机会为1/1000--这样,对于三个原子“气体”特殊区域体积就为相空间体积的千分之一。对于四球和非常大量的方格,机会为万分之一。对于五球和非常大量的方格,机会为十万分之一,等等。对于m球和大量的方格,机会为1/10m。这样,对于m原子“气体”,特殊区域的体积为“相空间”的1/10m。(如果把“动量”也包括在内,这仍然成立。)
     
      我们可以把这些应用于前面考虑的一盒实际气体的情形。但是现在,特殊区域不是占据总体积的十万分之一,而是一百万分之一(亦即一立方米中的一立方厘米)。这表明现在的机会不是1/10m,而是1/1000000m也就是1/106m。在通常的情况下,我们整个盒子中大约有1025个分子,所以我们取m=1025。这样,代表所有气体被局限在角落里的相空间的特殊区域只有整个相空间体积的
      1/1060000000000000000000000000
      状态的是包含代表该态的相空间区域体积V的测度。鉴于上述的这些体积间的巨大差别,最好不把它定义为和该体积成比例,而是定义为和该体积的对数成比例:
    =klogV
      取对数有助于使这些数显得更合情理。例如10000000的对数大约为16。量k称为玻尔兹曼常数。其数值大约为10-23焦耳/开尔芬。此处取对数的主要原因是使对于独立的系统成为可加量。这样,对于两个完全独立的系统,它们合并起来的系统的总为每一个单独系统的。这是对数函数的基本代数性质的推论:logAB=logA+logB。如果系统在它们各自的相空间中属于体积为AB的区域,则合并起来后的相空间中的区划体积就是它们的积AB,这是因为一个系统的每一可能性都必须各自分别计算。所以合并系统的的确为两个单独的的总和。)
      按照的观点,相空间中区划尺度的巨大差异显得更合理。上述的一个立方米的盒子的气体的只比集中在一立方厘米尺度的“特殊”区域的
      为14×1025)。
      为了得到这些区划的实际的值,我们要稍微忧虑所选择的单位(米、焦耳、公斤、开尔芬等等)。这有点离题太远,实际上,对于我马上要给出的极其巨大的值,选用何种单位根本没有什么本质上的不同。然而,为了确定起见(对于专家而言),我将采用由量子力学规则所提供的自然单位,这时玻尔兹曼常数就变成一:   k=1
     
    第二定律在起作用
     
      现在假定我们的系统从某种非常特殊的情形开始,譬如所有气体都在盒子的一个角落里。下一时刻,气体就会散开,并会急速地占领越来越大的体积。它过一阵就达到了热平衡。在相空间中看我们的图像应是什么样的呢?在每一阶段,气体所有粒子的位置和运动的完全的细节的状态都由相空间中的单独的一点描述。这一点在相空间中随着气体的演化而徘徊,这一精确的徘徊描述了气体中所有粒子的整个历史。这点从非常小的区域出发--该区域代表所有气体在盒子的一个特殊角落的所有初始态的集合。随着气体的扩散,我们运动的点进入了一个相当大的体积,这体积相应于气体以这种方式在盒子中稍微扩散开来。当气体向更远处扩散时,相空间的点继续进入越来越大的体积,新的体积以一个绝对巨大的因子使该点以前所在的体积完全相形见绌(图7.5)。在每一种情形下,一旦点进入更大的体积,(实际上)就根本没有在原先更小的体积中找到它的机会。最后它迷失在相空间中的最大的体积中--这相应于热平衡。这个体积实际上占领了整个相空间。人们可以完全放心,我们相空间的点在真正随机的徘徊中,在任何可以想象的时刻都不可能处在更小的体积中。只要达到热平衡,无论怎么弄,这个态都好好地待在那儿。这样,我们看到了简单地表达为相空间中适当区域体积的对数测度,其系统的随着时间无情增加的趋势。
    现在我们似乎为第二定律找到了一个解释!由于我们可以假定相空间的点不以任何特别设计的方式运动,如果它从相应于的很小的相空间体积出发,随着时间的流逝,它一定会以压倒一切的可能性不断进入越来越大的相空间体积,这相应于值的逐渐增加。
      但是,在我们用这个论证推导出来的结果中似乎有点古怪的东西。我们似乎已经推导出时间反对称的结论。在时间的方向增加,所以必须在相反的方向上减少。这个时间反对称从何而来?我们肯定没有引进过时间反对称的物理定律。时间反对称仅仅是从这一个事实而来,就是该系统从一个非常特别的(亦即低的)态出发,系统一旦这样地被启动,我们就看到它在未来的方向演化并发现在增加。这种增加的确和我们自己实际宇宙中的系统行为相符。但是,我们同样可以在时间的相反方向上应用这一论断。我们又可以在某一时刻使系统处在一个低的状态,但是现在要问的是,什么是在此之前的最可能态的系列。
      让我们试图以颠倒的方式来论证:和以前一样,从一个所有气体都待在一个角落的盒子里取其低态。现在相空间点处在我们以前出发的同一个微小的区域里。但是,现在让我们试图追踪它的往后方向的历史。如果我们想象,相空间中的点正如前面那样以非常紊乱的方式徘徊。随着向时间的相反方向的追踪,和前面一样地,它会很快地达到同样更大的相空间体积。这相当于气体在盒子中扩散了一些,但还没达到热平衡。体积越来越大,每一个新的体积都使原先的完全相形见绌。我们会发现,在更早的时刻它处于最大的体积中,这代表了热平衡。我们现在似乎得到推论,若在某一时刻,气体停在盒子的一个角落里,那么最可能的方式是,它是从热平衡出发才到达那里的,然后开始把自己集中在盒子的一端,最终把自己集中在盒子的一个很小的特定角落。在这整个过程中必须减少:它从最高的平衡值开始,然后逐渐减少,直到达到对应于气体被局限在盒子角落时的最低值!
      当然,这一点也不像在我们宇宙里实际上所发生的!不以这种方式减少,它增加。如果知道在某一个特定的时刻气体挤在盒子的某一角落,那么在这之前更多得多的可能是气体被后来很快移开的一块隔板紧密地限制。或者气体以凝聚态或液态被定在该处并很快地加热成为气态。对于所有这些可能性,原先的态的甚至更低。第二定律的确在起支配作用,总在增加--也就是它实际上在时间的相反方向上减少。现在,我们看到我们的论证给出了完全错误的答案!它告诉我们使气体跑到盒子的角落去的最可能的方式是从热平衡开始,然后随着的逐渐减少,气体会集中到角落上去;而事实上,在实际世界中,这是极不可能发生的。在我们的世界中,气体是从一种更可能(也即更低)的状态出发,挤在一个角落里的气体的不断增加到后来所具有的值。
     
     
    我们的论证虽然不能应用于过去的方向,似乎在未来的方向上可以。对于未来的方向,我们可以正确地预料到,只要气体从角落上出发,未来最可能发生的是将要达到热平衡,而不是突然出现分隔,或气体忽然凝固或变成流体。这么奇异的可能性正是表明,我们的相空间论证中似乎已正确地排除在未来方向降低的行为。但是过去的方向,这样奇异的可能性的确像是要发生似的--它们对我们而言一点也不奇异。当我们试图在相反的时间方向应用相空间论证时,我们会得到完全错误的答案!
      很清楚,这给我们原先的论证投下了疑问的阴影。我们没有推导出第二定律。事实上,该论证显示的只是,对于一个给定的低的状态(譬如讲气体被限制在一个角落里,那么在不存在任何约束此系统的外在因素时,则可望从该给定的状态在时间的两个方向上增加(图7.6)。这个论证在时间的过去方向上无效正是因为存在这种因素。过去的确有某种东西在约束这个系统。某种东西强迫在过去取低的值。在将来增加的这种趋势不足为奇。在某种意义上讲,高的态就是自然的“态”,这点就不必多加解释了,但在过去的低态是令人困惑的。是什么约束使得我们世界的过去的变得这么低?具有令人不可思议的低状态在我们居住的实在宇宙中普遍存在,虽然我们对这一点早已司空见惯,并通常不认为有什么大惊小怪,但它的确是一个令人惊异的事实。我们自己本身便是具有极小值的结构!从上述的论证可以看出,给定一个低态,我们不应该为后来的增加感到惊讶。应该惊讶的是,当我们考察它的过去时,变得越来越不可想象地低!
     
    宇宙中低熵的起源
     
      我们将要理解在我们居住着的实在世界中“惊人的”低从何而来。让我们从自身开始。如果我们能理解我们自身的低从何而来,则我们就应能看到被隔板限制住的气体、桌子上的水杯、炒锅上的鸡蛋或悬在一杯咖啡上的糖块的低从何而来。一个人或一群人(或者一只母鸡!)直接或间接地为每一种情形负责。我们自身的一部分低实际上有很大的程度被用以建立这其他的低态。也许牵涉一些附加的因素,例如使用真空泵把气体注入到隔板后面去。如果这台泵不是人工驱动的,则必须用某种“化石燃料”(例如石油)燃烧以提供必要的低能量使之运转。也许这台泵是电动的,则在一定的程度上要依赖于贮藏在核电站的铀燃料的低能量。以后我还会讲到其他低的源,但是现在我们先考虑自己身上的低
      我们自身的低究竟从何而来呢?我们身体的组织是由我们吃的食物和我们呼吸的氧气来的。人们经常听到这样的说法,即我们从食物和氧气的摄入中得到能量。但是只要想得更清晰一些就会发现这不是完全正确的。的确,我们消耗的食物和吸收到身体中来的氧气的化合为我们提供了能量。但是,大多数情况下,该能量又重新以热的形式离开我们的身体。由于能量是守恒的,在我们整个成年的生活中,身体实际上的能量含量或多或少是维持着一个常量,我们身体一点也没有必要再添加能量。我们不需要比我们已具有的更多的能量。事实上,当我们的体重增加时我们的确添加了能量,但通常这是多余的!还有,当我们从儿童长大,体格变健壮时,能量含量增加了相当多;这不是我在这里所关心的。问题在于我们如何使自己在正常(主要成年的)生活中存活。我们不必为此增加自身的能量含量。
      然而,我们确需要取代以热的形式连续损失的能量。事实上,我们越是“有精力”,则实际上以这种方式损失的能量越多。所以这能量都必须有所取代。热量是能量的最无序的形式,也就是说,它是能量的最高的形式。我们吸收形式的能量(食物和氧气)并以形式(热、二氧化碳、排泄物)排泄出去。我们没必要从我们的环境获取能量,因为能量是守恒的。但是,我们是在连续地对抗热力学第二定律守恒,它无时无刻地增加着。我们必须使自身的降低才能存活。为此我们从食物和大气氧气中吸收低的化合物,让它们在我们身体内化合,以高的形式释放能量,否则我们的体重就会增加。用这种方式,我们可维持我们身体内的不增加,并能保持(并甚至增加)我们的内部组织。(见薛定谔1967。)
      从什么地方来提供这些低呢?如果我们吃的食物刚好是肉(或蘑菇!),那正如我们一样要依赖于更外部的低源去提供和维持其低结构。这只不过把我们外部的低源的问题推到其他的地方。这样,让我们假定我们(或动物或蘑菇)消化植物。我们因为绿色植物的巧妙--不管是直接的或是间接的--而必须极其感谢它:因它吸收大气的二氧化碳,把氧气从碳中分离开来,而利用碳来建造它们自身的结构。这一光合作用的过程导致大量的降低。我们自己实际上在身体内把氧和碳重新简单地结合,用这种办法利用低的这种分离。绿色植物为什么能实现降的魔术呢?它们是利用阳光来实现的。阳光给地球带来了相当低形式的能量,即是可见光光子的能量。地球,包括它上面的居住者,不能保留此能量,而是(过了一阵)就把它全部重新辐射回到太空去。然而重新幅射的能量具有高的形式并被称为“辐射热”--它表明是红外光子。和普遍的印象正相反,地球(和居住者)并从太阳获得能量!地球所进行的只不过是取来低形式的能量,然后以高的形式全部把它吐回到太空去(图7.7)。太阳对我们所做的是给我们提供了巨大的低源。我们(通过植物的巧妙功能)利用了这些低,最终抽取某一极小的部分将其转换成惊人的、错综复杂的、有组织的结构,这就是我们自身。
     
      让我们以整体的观点考虑太阳和地球,能量和发生了什么变化?太阳以可见光光子的形式辐射能量。其中有一些被地球所吸收,它们的能量以红外光子的形式被重新辐射。现在,在可见光和红外光之间的关键差别在于前者有一个高频,所以单独光子比后者有更高的能量。(回忆一下在265页给出的普郎克公式E=hv。它告诉我们,光子的频率越高则能量越大。)由于每一可见光子比每一红外光子具有更高的能量,为了使进入地球的和离开地球的能量相平衡,只能有比离开地球的红外光子的数目更少的可见光子到达地球。地球吐回到太空去的能量被分散到比从太阳接收到的能量的多得多的自由度去。由于把能量再送回太空时牵涉到多得这么多的自由度,相空间的体积变得大得多,所以值就被极大地增加。绿色植物吸收低形式的能量(相对少量的可见光子)而重新把它以高形式(相对多量的红外光子)辐射,为我们提供了所需要的分解的氧和碳,以这种方法把低喂给我们。
      所有这一切之所以可能的原因是,太阳为天空中的一个热点!天空处于温度不平衡的状态;它的一个小区域亦即太阳占据的地方,比其他地方的温度高得多得多。这个事实为我们提供了所需要的强大的低源。地球从这一个热点得到低形式(少量光子)的能量,然后以高的形式(许多光子)重新辐射到冷的区域去。
      太阳为什么是这样的一个热点呢?如何才能得到这个温度的不平衡,并因此为我们提供低态呢?答案是它从原先均匀分布的气体(主要是氢气)的引力收缩形成的。在其形成的早期阶段,当它收缩时,太阳被加热上去。在到它的温度和压力达到一定点之前,也即除了引力收缩外,它还找到另一种叫作热核反应的能源,它会继续收缩并变得更热。热核反应使氢核聚变成氦核,并同时释放能量。如果没有热核反应,太阳会变得比目前的更热得多和小得多,直到最终消逝。热核反应使太阳不再继续收缩以免过热,从而使它稳定在适合于我们的温度上,能在更长久的时间里持续发光,否则的话早已熄灭。
      意识到这一点是很重要的。虽然热核反应在决定从太阳辐射来的能量的性质和多少方面无疑极具意义,但是引力才是关键之所在。(事实上,热核反应的潜力对太阳的低值的确有高度的贡献,但是聚变引起了微妙的问题,更充分的讨论,只使论证更为复杂,而不影响最终的结论。)3没有引力,甚至太阳根本就不会存在!没有热核反应太阳仍然发光--虽然不以适合我们的方式--但是没有引力就根本没有发光的太阳,的确需要引力来聚合物质,并提供所需要的温度和压力。若无引力,代替太阳之处我们只会有一团冷而弥散的气体,在天空中不会有热点!
      我未讨论到地球内“化石燃料”中的低来源,但是其考虑基本上是一样的。根据传统理论,地球上所有的油(和天然气)是来自于史前植物的生命,又是植物被当作低的来源。这些史前植物从太阳得到它们的低--;所以我们应该再次转向把弥散气体变成太阳的引力作用。托玛斯·高尔德提出了地球上石油起源的逆经叛道的理论。他不同意传统的观点,认为地球上存在比史前植物产生的更丰富得多的碳氢化合物。高尔德认为,油和天然气是在地球形成时被包含在地球内的,并一直连续地渗透出来直到下层的矿穴4。根据高尔德的理论,油在地球形成之前,即使在外空仍然是由阳光合成的。这又是起源于引力形成的太阳。
      用于核电站的铀235同位素的低核能量又如何呢?这的确不是原先从太阳(虽然在某阶段它也可能通过太阳),而是从某些其他的恒星来的。这些恒星在几十亿年前的一次超新星爆发中爆炸!这些物质实际上是从许多这类爆炸的恒星中聚集起来的。爆发把这些物质从恒星中吐到太空去,其中一些最终(通过太阳的作用)被聚集在一块,并把重元素提供给地球,包括它所有的铀235。每一个核子以及其低能量的贮藏是来自于发生在某次超新星爆发的激烈的核过程中。这种爆发是发生于恒星的引力坍缩5的余波。当恒星的质量过大,以至于热压力不能支持其自身时就会坍缩。一个小的核��可能以所谓的中子星的形式(后面还要更详细地讨论)在坍缩和紧随着的爆发之后残存下来。恒星原先是从弥散的气体云收缩而来,包括我们的铀235的许多原始物质又都被抛回到太空中去。残留下的中子星从引力收缩中得到了巨大的引力再次成为最主要原因--这一次它把弥散的气体凝聚成(过程最终是激烈的)一个中子星。
      我们似乎得出这样的结论,第二定律中最令人困惑的方面即所有在我们四周发现的明显的低,应归结于这样的一个事实,即通过弥散气体引力收缩成恒星的过程中可得到大量的。所有这些弥散气体从何而来?这些气体从弥散状态开始的这一事实为我们提供了大量的低贮藏。我们正在消耗这种低的贮藏,并将在未来的漫长岁月里继续如此。正是这些气体引力结团的潜力给我们带来了第二定律。此外,不仅仅是引力结团产生的第二定律,而且还有比下面简单陈述更精密和细致得多的某种东西:“世界是从非常低的开始的。”我们还可以用其他不同的方式得到“低”的,也就是说在早期的宇宙中有巨大的“显明有序”,但是这和在实际上呈现给我们的“有序”完全不同。(想象早期宇宙也许是正规的十二面体--这或许会投合柏拉图的心意--或者是其他某种不像会发生的几何形状。这的确是“显明有序的”,但并非我们预期在实际的早期宇宙中所发现的那种形状!)我们必须理解所有这些弥散气体从何而来--为此,我们必须转向宇宙论的研究。
     
    宇宙论和大爆炸
     
      我们如果使用最强大的望远镜--不管是光学的还是射电的,就会发现宇宙在非常大的尺度下显得相当均匀;但是更惊人的事实是,它正在膨胀。我们观测得越远,则遥远星系(以及甚至更远的类星体)就显得越快速地从我们这里离开。似乎宇宙本身是从一个巨大的爆炸事件中产生--事件称作大爆炸,它发生在大约一百亿年以前①。所谓的黑体背景辐射对于宇宙的均匀性以及大爆炸的实际存在提供了印象深刻的支持。它就是一种光的杂乱运动,而且是分辨不出来源的热辐射--其温度大约为2.7°绝对温度(2.7开尔芬),也就是摄氏-270.3°和华氏-455.5°。这似乎是非常冷的温度--也的确如此--但是它乃是大爆炸本身的那一瞬间的残留!因为从大爆炸的时刻以来,宇宙膨胀了这么巨大的因子,原始火球以一绝对巨大的因子发散开来。大爆炸的温度远远超过现在所能发生的温度,但是由于膨胀,该温度被冷却到今天微波背景所具有的微小的数值。1948年,俄国--美国物理学家和天文学家乔治·伽莫夫用现今标准的大爆炸图像作基础预言了这个背景的存在。在1965年彭齐亚斯和威尔逊首次(意外地)观测到它。
     
      我应该阐释经常给人们带来困惑的一个问题。如果宇宙中所有的远处星系都离开我们而去,是不是意味着我们自身在宇宙中占据着某种非常特别的中心位置呢?不,不是这样!不管我们位于宇宙中的何处,都会看到远处星系的同样的退缩。该膨胀在大尺度上是均匀的,没有一个位置比其他的更优越。通常可以用被吹胀的气球来描绘这种情景(图7.8)。假定在气球上存在代表不同星系的斑点,取气球本身的二维表面代表整个三维类空的宇宙。可以清楚地看到,所有气球上其他的点都从气球上的每一点退走。在这个方面,气球上没有一点比其他点更优越。类似地,从宇宙中的任何一个星系的有利地点来看,所有其他的星系在任何方向都同等地从它那里退走。
     
      三种标准的所谓弗里德曼--罗伯逊--瓦尔克FRW)宇宙模型之一,即空间封闭的正曲率的FRW模型,膨胀气球提供了非常好的图解。在另外两种(零或负曲率的)FRW模型中,宇宙以同样方式膨胀,但是这回空间不像用气球表面上标出的有限宇宙,我们拥有了包含了无限数目星系的无限的宇宙。 
      这两种无限模型中的较简单的一种是空间几何为欧几里德的那种,也就是具有曲率的。用一个通常的平面代表整个空间的宇宙,画在上面的点代表星系。当宇宙随着时间演化,这些星系以一种均匀的方式相互离开。让我们按照空间--时间来考虑。我们对每一“时刻”都有一个相应的而且不同的欧几里德平面,把这些平面想象成一个重叠在另一个上面。这样,我们一下子就有了整个空间--时间的图像(图7.9)。现在星系可用曲线--也就是星系历史的世界线--来代表,它们在未来的方向上相互离开。没有任何星系的世界线是特别的。
      对于星系的另一种FRW模型,也就是负曲率的模型,空间几何为欧几里德的罗巴切夫斯基几何,这种几何已在第五章中描述过并用图5.2181页)的埃索图来解释。在空间--时间描述中,我们在每一“时刻”都需要一个罗巴切夫斯基空间,我们并把这些一个重叠一个以构成整个空间--时间的图(图7.106。系的世界线又是在未来方向相互离开的世界线,没有什么星系是特别选择的。
     
     
      当然,在我们所有的这些描述中,空间的三个维中有一个被压缩掉了(正如我在第五章所做的,参阅221页),其目的在于给出比万不得已必须的完全的四维空间--时间图更易摹想的三维空间--时间图。甚至到了这种地步,如果不抛弃另一空间的维去摹想正曲率的空间--时间仍然非常困难!让我们就这么做,用一个(一维)圆周来代表正曲率的闭合的类空宇宙,而不用作为气球表面的(二维)球面。当宇宙膨胀时,这些圆圈的尺度变大。我们可把这些圆周(每一圆周代表一个“时刻”)一个一个地叠起来,结果得到一种弯曲的锥(图7.11a))。现在,从爱因斯坦的广义相对论方程得出,这种正曲率的闭合的宇宙不能永远地继续膨胀下去。在它达到最大尺度的阶段后,就会坍缩回去,最后会在一种倒转的大爆炸中达到零尺度(图7.11b))。有时把这种时间倒转的大爆炸称作大挤压。负曲率和零曲率(无限的)宇宙的FRW模型不会以这种方式坍缩。它们不会导致大挤压,而是继续无限地膨胀下去。
      至少在所谓宇宙常数为零的标准的广义相对论中,这是对的。具有适当的非零的宇宙常数,空间无限的宇宙有可能会坍缩成大挤压,或者有限的正曲率的模型会无限地膨胀下去:非零宇宙常数的存在会使这些讨论变得稍微复杂一些,但是对于我们的目的不会有任何重大的影响,为了简单起见,我把宇宙常数取为零。在写此书之际,从观测上知道宇宙常数是非常小的,其数据与零是一致的。(为了对宇宙模型有更多了解,可参考林德勒1977。)
      不幸的是,我们的数据还没好到足以清楚指出,我们的宇宙应是哪一种模型(也不能确定存在很小的宇宙常数,是否有重大的整体的效应)。表面上看来,数据似乎表明宇宙是类空地负曲率的(在大尺度上为罗巴切夫斯基几何),而且它会继续永远地膨胀下去:这主要是基于似乎以可见形式呈现的实际物质总量的观测。然而,也可能有大量的不可见物质散布在整个太空中。宇宙在这种情形下可以是正曲率的,并可能最终坍缩到大挤压去--虽然只会在比大约1010年,也就是宇宙已经存在的这么长的时间更长得多的时间尺度下发生。要使这种坍缩发生,必须存在大约为用望远镜可直接辨别的物质的三十倍的被假想地称为“暗物质”的、充满太空的不可见物质。的确有好些间接证据表明大量暗物质的存在,但是否足够“去封闭宇宙”(或使空间平坦)--并且坍缩--还在未定之天。
     
    太初火球
     
      让我们回到寻求热力学第二定律起源的问题上来。我们已经把它追踪到恒星由其凝聚而成的弥散气体的存在。那么气体又是从何而来的呢?它主要是氢,但仍有大约百分之二十三(按质量计算)的氦和少量其他物质。根据标准理论,这气体是由创造宇宙的爆炸--大爆炸吐出来的结果。然而,很重要的一点是,这不是我们通常熟悉的爆炸。在那里,物质从某一个中心点喷射到一个预先存在的空间中去。而在这里,空间本身由此爆炸创生出来,并从来不存在任何中心点!这种情形也许在正曲率模型中最容易摹想了。重新考虑图7.11或者图7.8中的吹胀的气球。并不存在任何大爆炸产生的物质可注入的“预先存在的空虚空间”。空间本身也就是“气球表面”是由爆炸产生的。我们必须意识到,为了摹想的方便,在正曲率模型的图像中利用了一个“包容空间”--也即气球所在的欧几里德空间--这个包容空间并没有任何物理实在性。在气球的内部和外部的空间只是用来帮助我们摹想气球的表面。只有气球表面本身才代表了宇宙的物理空间。现在我们看到了,并不存在一个让大爆炸产生的物质从该处发散出来的中心。刚好在气球中心的点不是宇宙的部分,而仅仅是用来帮助我们去摹想这一模型。大爆炸喷出的物质均匀地发散到整个宇宙的空间!
      其他两种标准模型的情形也是一样的(虽然要摹想它们更困难一些)。物质从未集中于空间中的任何单独的一点。它从一开始就充满了空间的全部   这个图像是称为标准模型热大爆炸理论的基础。按照这种理论,宇宙在其产生后的一瞬间处于极热的,称做太初火球的状态。关于这个火球的性质和成分以及当这火球(整个宇宙)膨胀并冷却时,这些成分如何变化都进行了细致的计算。对于描述宇宙的和我们现在如此不同的状态所进行计算的可靠性真是令人印象深刻!然而,只要我们不过问在创生后10-4以前发生什么的话,作为计算基础的物理学是无可争议的!从那个时刻也就是创生后的万分之一秒后,直到后来的三分钟,宇宙的行为已被非常仔细地算出(参阅温伯格1977)--而且奇异的是,我们从现在处于非常不同状态的宇宙的实验知识推导而来并很好建立的物理理论,对于这种计算是完全足够的7。这些计算的最后结论是,许多光子(也就是光)、电子和质子(氢的两种成分)、一些α粒子(氦的核)、还有少量重氢核(一种氢的同位素)和其他种类核的踪迹,也许还有大量的诸如中微子等等的几乎其存在不能被觉察得到的“不可见”粒子,都以一种均匀的方式散布在整个宇宙。其物质的成分(主要是质子和电子)会结合在一起,产生了恒星(主要是氢)在大爆炸后大约108年由之形成的气体。
      然而,不会立即形成恒星。在气体的进一步膨胀和冷却之后,为了局部的引力效应能开始战胜全局膨胀,某些区域的气体的相对集中是必须的。我们在这里进入了尚未解决且富有争议的星系实际上是如何形成的,以及星系可能形成的必须的初始无规性应是什么样子的问题。我不想对这些问题进行争论。我们只要接受,在初始气体云中应该存在某种无规性,引起了引力结团的某种正确方式,从而形成了包括千亿个恒星的星系。   我们已经找到弥散气体从何而来。它是从大爆炸本身的那个火球而来。正是该气体被极其均匀地分布于整个太空的事实带来了第二定律,在引力结团使增加的过程成为可能之后,我们就晓得了这定律的细节。实际宇宙中的物质怎样均匀地分布呢?我们注意到恒星聚集在一起形成星系;而星系聚集在一起形成星系团;星系团组成所谓的超星系团,甚至还有某些证据,这些超星系团聚集成更大的称为超星系团集合体的集团。然而,重要的是要注意到,所有这些无规性以及结团和整个宇宙结构的令人印象深刻的均匀性相比较都是“微小的”。能够往回观测的时间越早,则宇宙被测量的部分就越大,宇宙就显得越一致。黑体背景辐射为此提供了最令人印象深刻的证据。它特别告诉我们,当宇宙年龄仅仅为一百万年时,在现在已扩展开到1023公里的范围内--这是一个从我们这里开始能包含1010星系的距离--宇宙和它的所有的物质内容都均匀到十万分之一(参阅戴维斯等1987)。尽管宇宙的起源是非常激烈的,它在早期的确是非常一致的。
      这样,正是这个初始火球把这气体在整个太空发散得如此均匀。我们的探索也就是从此处开始。
     
    大爆炸能解释第二定律吗?
     
      我们的探索到达尾声了吗?是否仅仅由宇宙是从大爆炸开始的情景,就能解释在宇宙中的初始值是如此之低,并因此导致热力学第二定律的令人困惑的事实?稍微想一下就会发现这个观念中有一些矛盾。它不能是真正的答案。回想一下太初火球是一种热的状态--处于膨胀的热平衡的热气体。还有术语“平衡”是指具有最大的状态。(这就是我们在提到一盒气体的最大状态时说到的。)然而,第二定律要求,我们宇宙的在其初始态处于某种极小,而不是极大!
      何处出了毛病?一个“标准的”答案应该大体上如下:
      是的,火球在刚开始时实际上是处于热平衡,但是那个时刻的宇宙非常微小。火球所代表的是
    那一微小尺度的宇宙所能允许的最大的状态,但是这种允许的和在今天宇宙尺度下能允许的相比较是微不足道的。随着宇宙膨胀,可允许的最大随着宇宙尺度增加,但是宇宙中的实际的远远落在允许的最大值后面。由于实际的总是拼命去追赶允许的最大值,所以产生了第二定律。
      然而,稍微考虑一下便知道,这不应该是正确的解释。如果真是如此,在一个最终坍缩到大挤压的空间闭合的宇宙模型中,该论证在时间的颠倒方向上最终又能适用。适合于膨胀宇宙极早期并给予了我们低的同一限制应该又能适用于收缩宇宙的最后阶段。“时间开端”处的限制给了我们第二定律,根据第二定律,宇宙的随时间增加。如果把同一低的限制应用于时间的终结处,则我们应该在那里发现和热力学第二定律的严重冲突!
      当然,我们实在的宇宙也许永远不会以这种方式坍缩。我们也许生活在零曲率(欧几里德情形)或负曲率(罗巴切夫斯基情形)的宇宙中。我们也许生活在一个(正曲率)坍缩的宇宙中,但是坍缩将在这么遥远的时刻发生,现在我们觉察不到对第二定律的任何违反--尽管从这种观点看,宇宙的会倒转并减小到微小的值,从而按我们今天的理解,第二定律会被严重地违反。
      实际上,我们有非常好的理由怀疑,在一个坍缩的宇宙会有这种的反转。其中最有力的原因必须和称作黑洞的神秘物体相关。在一个黑洞中有一个坍缩宇宙的微宇宙;这样,如果在坍缩中的确要倒转,那么在一个黑洞附近必须能观察到第二定律的严重违反。然而,所有理由都使人相信第二定律强有力地支配着黑洞。黑洞理论为我们的的讨论提供了生动的内容,所以我们有必要稍微仔细地考虑这些奇怪的物体。
     
    黑洞
     
      让我们首先考虑理论所预言的关于我们太阳的最终命运。太阳已经存在了大约五十亿年。它再过五十或六十亿年就会在尺度上开始膨胀,它会无情地肿大,直到表面大致达到地球的轨道。那时它就变成为称作红巨星的一种恒星类型。在天空中的其他地方能看到许多红巨星,两个最著名的是在公牛座的阿尔德巴伦和猎夫座的贝特勒宙斯。在其表面膨胀的全过程中,在它的核心会有一个异常紧密的物质浓缩体,在逐渐地变大。这个紧密的核心具有白矮星的性质(图7.12)。
     
     
      白矮星自身实际上是物质集中到极高密度的恒星。它的密度相当于一个乒乓球的体积充满了几百吨重的物质!在天空中可以观察到相当数目的这类恒星:也许在我们银河系发现的恒星中有百分之十几为白矮星。最著名的白矮星是天狼星的伴星,其惊人的高密度在本世纪初给天文学家带来了巨大的观察上的困扰。然而,后来这同一颗恒星为(在1926年左右R.H.否勒开创的)物理理论提供了美妙的证实。根据这个理论,有些恒星的确可以具有这样巨大的密度,该恒星由“电子简并压力”支撑着。这表明当泡利量子力学的不相容原理(第320页)应用于电子时,可以防止恒星遭受向内的引力坍缩。
      任何红巨星的核心都有一个白矮星,这个核心会继续从恒星的主体收集物质。红巨星最终被这个寄生的核完全消耗,而大约有地球那样尺度的实际的白矮星成为仅有的幸存者。可以预料,我们的太阳作为红巨星的形式“仅仅”会存在几十亿年。然后,在它的最后的“可见”肉身--作为一个慢慢冷却地死去的白矮星的余烬--太阳将再维持几十亿年,最后完全变阴暗了,成了看不见的黑矮星   不是所有的恒星都具有太阳的命运。对于一些恒星,它们的结局会更为激烈。它们的命运为所谓的强德拉塞卡极限所决定:这就是白矮星所能具有的最大的质量值。根据1929年萨拉玛尼安·强德拉塞卡的计算,如果恒星的质量大于太阳质量的一倍半的话,白矮星不能存在。(他是一位年轻的印度研究生候选人,在他从印度到英国的航船上作出这个计算的。)这个计算在1930年左右由苏联的列夫·蓝道独立地重复过。现代改善了的强德拉塞卡极限值大约为
      1.4M
      这里M代表太阳质量,亦即M等于一个太阳质量
      请注意强德拉塞卡极限比太阳质量大不了多少。而我们知道许多通常的恒星的质量比这个质量大得多。例如,质量为2M的恒星的最终命运是什么呢?根据已有的理论,这些恒星又会肿大变成红巨星,正和前面一样,它的白矮星核会慢慢地得到质量。然而,在某一临界阶段,核质量会达到强德拉塞卡极限,而泡利不相容原理将不足以抵抗巨大引力所引起的压力8。在这一点前后,核心灾难式地向内坍缩并遭受到温度和压力的巨大增加。发生了激烈的核反应,从核中以中微子的形式释放出极大的能量。这些把恒星正在向内坍缩的外面区域加热上去,紧接着的是一巨大的爆炸。这个恒星就变成了超新星!
      仍在坍缩的核发生了什么呢?理论告知我们,它甚至达到比白矮星惊人的密度还要巨大得多的密度。这核可以作为一个中子星而稳定下来(371页),现在是中子简并压力--也即泡利原理应用于中子--支持着它。它的密度是如此之大,以致于乒乓球大小的体积含有的中子星物质和赫米斯小游星(或者是火星的月亮狄莫斯)一样多。这是原子核中的密度(一个中子星像是一个巨大的原子核,半径大约为几十公里,然而以恒星的标准来看极其微小!)但是,现在有了新的极限(称为蓝道--奥本海默--沃尔科夫极限),它和强德拉塞卡极限很类似。其现代(修正)值非常粗略地为
      2.5M
      若质量超过这一数值中子星就维持不住。   如果原先恒星的质量足够大,甚至超过这一极限,其坍缩的核会发生什么呢?譬如讲,许多已知恒星的质量的范围是从10M100M。看来不断地把这么多质量抛出,使剩余下的核的质量低于中子星极限是非常不可能的。与此正相反,预料的结果是会产生黑洞
      什么是黑洞?它是空间或者空间--时间的一个区域,在那里引力场变得如此之强大,甚至连光都不能逃逸。我们记得,相对论原理的一个含义是光速为一极限速度:没有物体或讯号能超过局部的光速(参阅222242页)。所以,如果光都不能从黑洞逃逸,没有任何东西可能逃逸。
      读者或许听说过逃逸速度。这是为了从某一大质量物体逃逸的一个物体必须具有的速度。假设该物体是在地球上,则从地球逃逸的速度为每小时四万公里,也就是大约为每小时二万五千英里。从地面向任何方向抛出的具有超过此速度值的石头都会完会逃离地球(假定我们忽略空气阻力的效应)。如果以低于此值的速度抛出,则它会落回到地球来。(这样,“任何投掷体必须回归”的命题是不对的;只有它的抛出速度低于逃逸速度时才会返回!)对于木星,逃逸速度为每小时22万公里,也就是大约每小时14万英里;对于太阳为每小时220万公里,或大约为每小时140万英里。假定我们现在想象太阳的质量集中于一个只有现在半径的四分之一的球体里,则需要的逃逸速度就要加倍;如果太阳还要更加紧密,比如讲半径减小到百分之一,则速度要增大到十倍。我们可以想象对于足够大质量的和足够集中的物体其逃逸速度甚至会超过光速!这种事发生时,我们就有了一个黑洞9
      我在图7.13中画出了一个物体坍缩而形成黑洞的空间--时间图(我在这里假定,物体在坍缩的过程中近似地维持着球对称。而且我在这里压缩了空间的一个维数)。我也把光锥画出,正如我们在第五章(参阅238页)讨论广义相对论时所知道的,它们表明物体运动或讯号的绝对限制。我们注意到,光锥向中心倾斜,并且越是靠近中心就越倾斜。
      存在一个称作施瓦兹席尔德半径的临界距离,在这距离下光锥的极限在图中变成垂直的。在这距离下光(它必须沿着光锥)只能在坍缩物体上徘徊,光所具有的所有的向外的速度只刚好足以抵抗引力的巨大吸引。在施瓦兹席尔德半径处,这些徘徊的光(也即光线的整个历史)在空间--时间中的轨迹构成的三维面称为黑洞的(绝对事件视界。任何在视界之内的东西都不能逃离或者甚至都不能和外面的世界通讯。这可从光锥的倾斜以及所有运动和讯号被限制在这些光锥之内(或之上)的基本事实看到。由几个太阳质量的恒星坍缩形成的黑洞,其视界的半径为几公里。预料在星系中心存在质量大得多的黑洞。我们银河系的中心很可能包含有一个大约一百万太阳质量的黑洞,其视界的半径为几百万公里。
      坍缩形成黑洞的实际物质将完全在视界之内完结,而且那时它不能和外界通讯。我们简要地考虑一下该物体的可能命运。此刻,我们所关心的仅仅是由它的坍缩产生的空间--时间几何--一种具有极其古怪含义的空间--时间几何。

      我们想象一个勇敢(或愚勇)的太空人B,他决心旅行到一个大黑洞中去。而他的胆怯(或谨慎)的同伴A安全地留在事件视界之外。让我们假定A以视线尽可能长久地追踪B的行踪。那么A将看到什么呢?从图7.13可以肯定,A永远见不到B在视界之的历史(亦即B的世界线)的部分,而A将最终见到B在视界之的历史部分--虽然在B穿越水平的前一瞬间,由A看起来必须等待越来越长的时间。假定B在自己的钟为12点时穿过视界。A实际上永远见不到这一事件。但在在钟表读数为1130 
      相同间隔的时间里)。原则上,对于A而言,B总能被看到,并且显得永远在视界上徘徊,而且B的表在接近这致命的12点钟时显得越来越慢,并永远不能达到这一时刻。实际上,B的影像会非常快地变得朦胧以至无法辨别。这是因为,从B刚好在视界外的世界线的小片段来的光,必须发散在A所经历的余下的时间内。换言之,BA的视线内消失--这一点也适合于原先的整个坍缩物体。A所能看到的全部的确只能是一个“黑洞”!
      关于可怜的B的境况又如何呢?他的经验又如何呢?必须首先指出,当B穿过视界之时,他不会有任何异样的感觉。他凝视着他的手表记录12点钟,他看到了一分钟一分钟规则地流逝。1157115811591200120112021203。在12点附近似乎没有任何古怪的事发生。他可以回头看A,并发现在整个时间里A总被连续地看到。他可以看到A自己的表。对于B来讲,A的表以一种正常的规则的方式运行。除非B已经计算出他应该穿越这视界,否则他无法知道这一事件10。视界极端阴险。B一旦穿越进去,就再也逃脱不出来。他的局部宇宙最终会在他周围坍缩,他注定很快就要遭受到自己的“大挤压”。
      这也许不是纯粹私人的事务。在某种意义上,形成黑洞的坍缩物体的全部物质首先和他分担“同样”的挤压。事实上,如果在黑洞之的宇宙是空间闭合的,这样外界的物质也会最终卷入到包罗一切的大挤压中去。那么可以预料,这种挤压和B的“个人”挤压相同
      尽管B的命运令人不快,但我们认为,一直到这点为止,他所经验到的局部物理学不会和我们已知并理解的物理学有任何抵触之处。尤其是,我们预料他不会觉得热力学第二定律被违反,更不用说完全反演的增加行为了。第二定律在黑洞之内,正如同在其他地方一样成立。B附近的仍然增加,直到他的最后挤压为止。
      为了理解在(“个人的”或“包罗万象的”)“大挤压”处的值确实极高,而在大爆炸处低得多,我们还需要进一步研究黑洞的空间--时间几何。但在此之前,读者也应先浏览一下图7.14,该图画出了称作白洞的黑洞的假想时间反演。自然界中也许不存在白洞。但是,它们的理论可能性对于我们具有相当重大的意义。
    空间--时间奇点的结构
     
      我们从第五章234页知道,空间--时间曲率如何以潮汐效应的方式呈现出来。一些在某大物体引力场中自由下落的粒子组成的一个球面在一个方向上被拉伸(沿着朝向引力物体的直线)和在与这垂直的方向上被压挤。这种潮汐效应随着和引力物体的接近而增大(图7.15),其强度变化和离开此物体距离的立方成反比。太空人B在向黑洞内部下落之时便会感到这一增强的潮汐效应。对于一个几倍太阳质量的黑洞,潮汐效应是巨大的--以至于这太空人在靠近黑洞时根本就不能存活,更不用说他穿越黑洞视界了。对于更大的黑洞,视界处的潮汐效应实际上更小。许多天文学家都相信,在银河系中心可能存在一个大约一百万太阳质量的黑洞。当太空人穿越这黑洞视界时,其潮汐效应应该是相当小,虽然也许足以使他稍微感到不舒服。然而,只在太空人穿越之后的很短时间里,这种潮汐效应才继续维持很小。事实上,只要几秒钟的时间它就迅速地达到无限大!不仅这位可怜的太空人的身体会被这一增强的潮汐效应撕开,而且组成他的分子、所包含的原子、它们的核,以及最后甚至所有次原子粒子很快地也难逃厄运!“压榨”正以如此方式施展其终极的淫威。

     
      不仅是所有物体以这种方式被毁灭,甚至空间��时间本身都面临着它的终点!这种最终灾难称作空间--时间奇点。读者一定会问,我们何以知道这种灾难一定会发生,在何种情况下物体和空间--;时间注定要遭此厄运。在任何形成黑洞的情形下,这些是从广义相对论的经典方程引出的结论。奥本海默和斯尼德(1939)原先的黑洞模型呈现了这种行为。然而,许多年来天体物理学家总是抱着幻想,认为奇性行为只是在该模型中假定的特殊对称性的孽障。在现实(非对称)的情况下,坍缩的物体也许会以某种复杂的形式旋开并重新逃到外头去。但是,在进行了更一般的数学论证后,这种希望就破灭了。这些论证的结果被称作奇点定理(参阅彭罗斯(1969),霍金和彭罗斯(1970)。)这些定理断言,在具有合理物质源的广义相对论的经典理论中,引力坍缩情形中的空间--时间奇性是不可避免的
      利用时间方向的反演,我们又类似地发现相应的初始的空间--时间奇性的不可避免性。这奇点在任何(适当的)膨胀宇宙中代表大爆炸。此处奇点不代表所有物质和空间--时间最终的毁灭,它代表空间--;时间以及物质的创生。在这两种奇点之间也许存在一个准确的时间对称:初始奇点,空间--时间以及物质在该处创生;和终极奇点,空间--时间以及物质在该处消灭。在两者之间的确存在着一个重要的相似,但是在我们仔细考察之后,就会发现它们并准确的时间反演。它们的几何差异对于我们的理解意义重大,因为它们包含热力学第二定律起源的关键!   让我们回到自我牺牲的太空人B的经验上来。他遭遇到了很快就要增强到无限大的潮汐力。由于他是在空虚的空间中旅行,所以经历了体积守恒和畸变效应,后者是我早先表达成魏尔(见第五章234242页)的空间--时间曲率张量所提供的。空间--时间曲率张量中代表整体的压缩,并称作里奇的余下的部分在空虚空间中为零。也可能在某一阶段,B在事实上遭遇到物质,但是甚至在发生这种情形时(毕竟他自身是由物质所构成的),我们仍然普遍地发现魏尔的测度比里奇大得多。我们预料,接近于最终奇点时的曲率完全是由魏尔张量所主宰。一般地讲,此张量趋近于无穷大
    魏尔→∞,   (虽然它会以振荡的形态出现)。这是空间--时间奇点11一般情形。这种行为和高熵的奇点有关联。
      然而,大爆炸处的情况与此完全不同。我们早先考虑过的高度对称的弗里德曼��罗伯逊��瓦尔克空间��时间提供了大爆炸的标准模型。魏尔张量提供的畸变的潮汐效应在这里完全不存在。取而代之的是作用在检验粒子的球面上的对称的向内的加速度(见图5.26)。这是里奇张量而不是魏尔张量的效应。在任何FRW模型中,张量方程
    魏尔=0
      总是对的。当我们越来越接近这一初始奇点时,我们发现是里奇而不是魏尔变成无穷大。这就为我们提供了低熵的奇点。   如果我们在一个准确的坍缩的FRW模型中考察大挤压奇点,我们就会发现在挤压处,魏尔=0,而里奇趋于无穷大。然而,这是一种非常特殊的情形,我们不会在完全现实的模型中预料到这种现象。在现实模型中必须计入引力成团的效应。随着时间的演化,原先以弥散气体的形式存在的物质将结团成恒星的星系。大量恒星将会由于引力收缩而渐序变成:白矮星、中子星和黑洞,以及在星系的中心可能会有的某些巨大的黑洞。这种成团--尤其是在黑洞的情形下--代表了的巨大增加(见图7.16)。这初看起来使人困惑不解,成团的态代表,而均匀的态代表低。我们记得,在一盒气体的情形,成团(譬如所有气体都处于盒子的一个角落)的态具有,而热平衡均匀的态的更高。但是考虑到引力,则这一切都被颠倒过来,这是由于引力场的普遍的吸引性质引起的。随着时间的推移,成团现象变得越来越极端,最终凝聚成许多黑洞。它们的奇点联合成极其复杂的终极的大挤压奇点。终极奇点决不像坍缩的FRW模型中受魏尔=0限制的理想大挤压。在所有的时间里,随着越来越多的结团发生,存在魏尔张量变得越来越大的倾向12。一般来讲,在所有的终极奇点处魏尔→∞。图7.17画出了一个代表闭合宇宙,和一般描述相一致的整个历史的空间--时间图。
      现在,我们看到一个坍缩的宇宙为何必具有低。大爆炸处的的“最低值”为我们提供了第二定律--因此,这不仅仅是大爆炸时刻宇宙“小尺度”的推论!如果我们把上面得到的大挤压图像作时间反演,我们应得到一个具有极其巨大的“大爆炸”,因而不存在第二定律!由于某种原因,宇宙在一种非常特殊(低)的态下创生出来,加上的限制有点像在FRW模型中的魏尔=0。如果没有这种性质的根制,“更可能”的情况是,初始和终结奇性具有高魏尔→∞的类型(见图7.18)。在这种“可能”宇宙中的确不会有热力学第二定律

     
     
     
     
    大爆炸是何等特殊?
     
      让我们试图理解在大爆炸处魏尔=0的条件下所受到的限制程度。为简单起见(正如上述的讨论),我们假定宇宙是闭合的。为了能得出某些清晰的数字,我们进一步假定在宇宙中质子和中子的总数目,也就是重子B
      B=1080
      除了在观测上B必须至少有这么多以外,(并没有什么选取这一数目的特别理由;有一回爱丁顿断言,他准确地计算出B,其数值和上面的值很接近!似乎再也没有人相信这一特殊的计算,但是这一数值就一直停在1080上。)如果B的数值取得比这更大(或许实际上B=∞,),那么我们就会得到比现在即将得到的异乎寻常之数字更为惊人的结果!
      想象一下整个宇宙的相空间(参阅202页)!这一相空间中的每一点代表宇宙启始不同的可能方式。我们可以想象造物主,它把一个针尖点在相空间中的某一点上(图7.19)。针尖的不同位置提供不同的宇宙。而造物主目标所需的精度决定于它所创造的宇宙的。由于相空间的巨大体积可让针尖去戳,所以产生一个高宇宙是相对“容易”一些。(我们记得和有关相空间的体积的对数成正比。)但是,为了使宇宙从低态起始��以保证存在热力学第二定律��造物主必须瞄准相空间中极其细微的体积。为了使结果和我们生活其中的宇宙相类似,这一区域应该是多小呢?要回答这个问题,首先必须先提到一个非常出色的公式,由雅科布·柏肯斯坦(1972)和史蒂芬·霍金(1975)所发现计算黑洞的公式。
      考虑一个黑洞,并且假定其视界面积为A。柏肯斯坦��霍金黑洞公式则为:
        
    除以2π。此公式的主要部分为A/4。括号内的部分只不过是包括了合适的物理常数。这样,黑洞的和它的表面积成正比。对于一个球对称的黑洞,此表面积和黑洞质量的平方成正比
      A=m2×8π(G2/c4)
      把它和柏肯斯坦��霍金公式合并,我们就看到黑洞的和它的质量平方成比例:
     
      
      这样,黑洞的单位质量的熵Sbh/m)和它的质量成正比,所以黑洞越大,它就越大。因此,对于给定的质量,或由于爱因斯坦的公式E=mc2而等效的能量,当物质坍缩成一个黑洞时获得最大的!而且,当两个黑洞相互并吞而产生一个单独黑洞时得到巨大的!诸如在星系中心发现的那些巨大的黑洞能提供极其了不起的值��远比在其他类型的物理情形下遇到的值大得多。
      只需要很少的条件就可断言,当所有质量都集中到一个黑洞中时得到的最大。霍金的黑洞热力学分析指出,必须有一非零的温度和黑洞相关联。其中的一个含义便是,并非所有的质量能量都包含在黑洞之中。在最大状态下,最大是在一个黑洞和“辐射的热库”相平衡时才获得。对任何合理尺度的黑洞,这幅射温度实在非常小。例如,一个太阳质量的黑洞,其温度大约为10-7K,这比迄今在任何实验室里所能测量到的最低温度还要低,比星际空间的2.7K温度低得多了。对于更大的黑洞,其霍金温度甚至还要更低!
      只有在下面两种情形下霍金温度对于我们的讨论才有意义:(i)也许在我们宇宙中存在称为微黑洞的微小得多的黑洞;或(ii)宇宙不在霍金蒸发时间,也就是黑洞完全蒸发所需的时间之前坍缩。关于(i),微黑洞只能在适当的混沌大爆炸时产生。实际中这类微黑洞不会大量存在,否则它们的效应应该已被观测到;而且,依我的观点,它们根本就不存在。关于(ii),对于太阳质量的黑洞,霍金蒸发时间大约为目前宇宙年龄的1054倍。对于更大的黑洞,其时间要长得多。这些效应似乎不会根本改变上述的论断。
      为了对黑洞的巨大数值有一概念,我们可以考虑原先以为对宇宙有最大贡献的2.7K的黑体背景辐射。这种辐射所包含的巨大数量的慑服了天体物理学家,它远远超过人们在任何其他过程(例如在太阳中)所遭遇到的通常的值。背景的大约是每一个重子108。(此处我选用“自然单位”,这样玻尔兹曼常数为1),(实际上,这表明每个重子在背景辐射中对应于108个光子。)所以,如果共有1080重子,则我们宇宙中的背景辐射应有总
      1088
      如果没有黑洞,这一数值的确代表了宇宙的总,由于背景辐射中的淹没了所有其他通常过程的。例如太阳中的每个重子数量级1。另一方面,按照黑洞的标准背景辐射的是微不足道的。柏肯斯坦��霍金公式告知我们,在太阳质量的黑洞中每一重子大约在1020自然单位左右。这样,要是宇宙全部由太阳质量黑洞所构成,则总数值会比上面给出的大许多,也就是
      10100
      当然,宇宙不是这样构成的,但是这一数值开始告诉我们,当计入引力的无情效应时,背景辐射的是如何地“微小”。更现实一点,假定我们的星系不完全由黑洞组成,而主要由通常的恒星组成,在包含1011个通常恒星的星系的核中假如有个一百万(亦即106)太阳质量的黑洞(这对我们自己的银河系是合理的)。计算结果指出,现在每个重子实际上比前面巨大的数值还要大,也就是1021。这样,以自然单位给出的总
      10101
      我们可以期待,在非常长的时间后,星系质量的主要部分会被并吞到它们中心的黑洞中去。发生此事之后,每一重子变为1031,其总具有极大的数值
      10111
      然而,我们是在考虑一个闭合的宇宙,这样它将最终坍缩;所以,似乎整个宇宙形成为一个黑洞。可以合理地利用柏肯斯坦��霍金公式估计最终大挤压的。这就给出了每一重子1043,而整个大挤压的无与伦比巨大的总
      10123
      这一个数值给出了造物主所能得到的相空间总体积的估计。应该表达成最大区域体积的对数。由于10123是该体积的对数,所以其体积按自然单位应为10123的指数,也就是
      
    10在本质上是可互相取代的!)为了给我们提供一个和热力学第二定律以及我们现在所观察的相一致的宇宙,造物主必须瞄准的原先的相空间体积W应为多大呢?我们取下面的两个数值中的任一个根本关系不大
     
      它们分别为星系黑洞或者背景辐射给出的数据,或是在大爆炸处更小得多(事实上更为合适)的实在的数据。不管哪种数值VW的比率接近于
     
      这是一个异乎寻常的数值。人们甚至不能把这个数以通常十进位的办法完全写下来。它是1后头连续跟101230!甚至如果把0写在整个宇宙中每一颗单独的中子和质子上��还可以加上所有其他的粒子��人们发觉还是远远不够写下所需要的这一个数值。使宇宙准确地运作所需要的精度,比制约从一个时刻到另一时刻事物行为的任何超等动力方程(牛顿、马克斯韦、爱因斯坦的方程)我们已习惯的精度毫不逊色。
      但是,为何大爆炸是如此精密地策划的,而大挤压(或黑洞中的奇点)却是预料中完全混沌的呢?这可按照在空间��时间奇点处的空间��时间曲率的魏尔部分的行为来重述这个问题。我们发现在初始的而不是终结的奇点处存在约束
    魏尔=0
      (或某种和它非常类似的东西)。似乎正是这个限制造物主选择相空间内这个非常微小的区域。这限制适合于任何原始(而非终结)的空间��时间奇点。我把它称作魏尔曲率假设。这样,如果我们要理解第二定律从何而来,似乎就必须理解为何这样的一个时间反对称的假设必须成立13
      我们如何才能对第二定律的起因有更深入的理解呢?我们似乎被逼迫到死路上去。我们必须理解为何空间��时间奇点具有它所具有的结构;但是空间��时间奇点是我们物理理解达到极限的区域。有时人们把空间��时间奇点存在所导致的死胡同和另一事件相提并论:那就是本世纪初物理学家研究原子稳定性(参阅262页)所遭遇到的困难。在每种情况下,早已确立的经典理论总是得出“无穷大的”答案,因而经典理论对于这样的使命无能为力。量子理论阻止了原子电磁坍缩的奇异行为,正如量子理论应在恒星的引力坍缩“无限的”经典空间��时间奇点处得到有限的理论。但是这绝不是通常的量子理论。它必须是空间和时间结构本身的量子力学。这样的理论,若存在的话,应称为“量子引力”。量子引力还不存在并非因为物理学家不努力,或者没有专长和天才。许多第一流的科学头脑专心致志于建立这样的理论,惜未成功。这是我们试图理解时间流逝的方向性时所最后面临的绝境。
      读者一定会问,我们经历了什么样的旅途。在我们追求理解为何时间显得只向一个方向而不向另一方向流逝的过程中,我们已经旅行到时间的最终点,在该处空间概念本身都被瓦解了。我们从这一切得到了什么教益呢?我们发现理论还不足够于提供答案。但是,这对我们试图理解精神又有什么用场呢?尽管缺少足够的理论,我相信我们的航程的确给予我们重要的教导。现在我们应该回过头来。我们的归程将比出发更加冒险,但是依我看,没有其他合理的归途!
      1.一些相对论“纯粹者”宁愿用观察者的光锥,而不用他们的同时空间。然而,这对此结论毫无影响。
      2.这本书印出后,我发现到那时候两个人都早过世了,只能是他们遥远的后代再回过来“邂逅相遇”。
      3.在恒星中从轻核子(例如氢核)合并成重核(例如氦核,或最终铁核)的过程会得到。同样的,地球上存在的氢中有许多“低”,我们总有一天可以利用其中一些,使之在“聚变”核电站中转化成氦。通过这种手段得到的可能性是由于引力已经使得核集中到一起,从而使之离开那些逃逸到浩瀚的空间去的、现在构成2.7K黑体背景辐射的大量光子(参阅373页)。该辐谢中包含有比存在于通常恒星中的物质大得多的。如果它们完全集中到恒星物质中去,它能用以使大多数这些重核分解为构成它们的粒子!所以在聚变中得到的是“暂时的”,引力集中效应的存在才使之成为可能。将来我们会看到,尽管通过核聚变得到的和迄今直接通过引力得到的大多数情况相比是非常大��而黑体背景中的更巨大得多��这纯粹是局部和暂时的状态。引力的源比聚变以及2.7K辐射大到无与伦比的程度(参阅398页)!
      4.可以把在瑞典的超深的钻井的最近证据解释作对于高尔德理论的支持。但是,该结论是非常令人争议的,还存在另外的传统解释。
      5.我在这里假定这是所谓的“第Ⅱ类”的超新星。若是“第Ⅰ类”的超新星,我们就再按照从聚变(参阅注释3)提供的“暂时的”获得来考虑。然而,类型Ⅰ超新星不太可能产生大量铀。
      6.我将具有零或负曲率的模型称为无限模型。然而,存在将这些模型“卷叠”使之成为空间有限的方法。这种不太可能和实际宇宙相关的考虑,不会太大影响讨论,我不在此为之忧虑。
      7.此信念的实验基础主要来自两类数据。第一,粒子以这种相关的速度相互碰撞的行为、反弹、分裂以及产生新粒子。这可从在地球上不同地点建造的高能粒子加速器,以及从由外空打到地球上的宇宙线的行为得知。其次,我们知道制约粒子相互作用方式的参数在1010年内的改变量甚至小于106分之一(参阅贝娄1988)。这样,非常可能的情形是,从太初火球时代开始,它们根本就没有显著地改变过(或可能根本不变)。
      8.泡利原理实际上不禁止一个电子和另一个电子待在同一“地方”,但是它禁止它们二个处于同一“态”��态牵涉到电子如何运动和自旋。这在实际论证中有一点微妙。它在第一次提出时引起了许多争议,尤其是来自爱丁顿的。
      9.英国天文学家约翰·米歇尔早在1784年,以及稍后些拉普拉斯亦独立提出这样的论证。他们的结论是,宇宙中大多数的大质量和集中的物体,正如黑洞那样,也许的确完全看不见。但是他们预言式的论证是利用牛顿理论进行的,因此这些结论充其量只是在某种程度上可使人信服。约翰·罗伯特·奥本海默和哈特兰德·斯瓦德(1939)首次提出了适当的广义相对论的处理。
      10.事实上,在一般的非静态黑洞的情形下,视界的准确位置不是某种可由直接测量确定的东西。它部分地依赖于知道所有物质在其将来都会落入黑洞。
      11.见别林斯基、哈拉特尼科夫和栗弗席兹(1970)和彭罗斯(1976b)的讨论。
      12.将引力对系统的贡献用整个魏尔曲率来测度是诱人的,但何种测度才合适仍不清楚。(一般来说,需要具有某种古怪的非局部性质。)幸运的是,这种引力的测度对于现在的讨论不必要。
      13.现在存在一种众所周知的观点,称之为“暴涨模型”。它的目的是为了解释,譬如讲宇宙在大尺度下的均匀性。根据这个观点,宇宙在其极早期遭受到一个巨大的膨胀��其膨胀数量级比大爆炸模型中的“通常”膨胀大得多。其想法是,任何无规性都被这个膨胀所抹平。但是,如果没有某种更巨大的初始限制,例如由魏尔曲率假设所提供的限制,暴涨不会发生。它并没有引入时间不对称的因素,用于解释初始和终结奇性之间的不同。(并且它是基于不牢固的物理理论��GUT理论��按照第五章的分类法��其状况并不比尝试类更好些。可参阅彭罗斯(1989b)在本章观念的框架中,对“暴涨”的批评。)
     

    xian.name  All rights reserved.
     



    這是 Google 對 http://xian.name/cn/readers/03/835.htm 的快取。 這是該網頁於 2015年1月21日 12:24:46 GMT 顯示時的快照。 在此期間,目前網頁可能已經變更。 瞭解更多資訊
    提示:如要在這個網頁上快速尋找您所搜尋的字詞,請按下 Ctrl+F 鍵或 ⌘-F 鍵 (Mac),然後使用尋找列進行搜尋。

     
    第五章经典世界
    二先网
    English                      chinese
      115年1月25日 星期日
     
    主页物理读物心理控制期货策略醉放作品关于本站

     
    第五章经典世界
     
    物理理论的状况
     
      为了了解意识如何是自然的一部分,我们对自然的运行要知道哪些呢?制约身体和头脑组成基元的定律与此关系重大吗?如果真的像许多人工智能的拥护者所竭力说服我们的那样,意识理解仅仅是由算法所规定的,那么这些定律实际上是什么样子的则是无关紧要的。任何能够实现算法的仪器都一样好。另一方面,也许我们的知觉比可怜的算法更富有内容。也许构成我们的确切方式正和实际上制约构成我们物质的物理定律一样重要。我们也许需要理解构成物体物质以及规定所有物体行为的根本性质。物理学尚未做到这一步。许许多多的秘密还有待揭示和探索。然而,大多数物理学家和生理学家却断言,我们已经拥有足够的关于通常尺度的、诸如人脑物体运作的物理定律的知识。作为一个物理系统,大脑毫无疑义是极端复杂的,我们对其结构的大部分细节和相应功能相当无知。但是少数人说,人们对作为构成其行为基础的物理原则的理解不存在任何重大缺陷。   相反地,我在下面将持一种非传统的论点,也就是我们对物理学的理解,甚至在原则上还不足够用以描述我们大脑的运作。为了论证这一点,我首先必须概述物理学的现状。本章是关于所谓的“经典物理”,它包括牛顿力学和爱因斯坦相对论。此处“经典”基本上是指在1925年左右发现量子理论之前的占统治地位的理论。量子力学是由诸如普郎克、爱因斯坦、玻尔、海森堡、薛定谔、德布罗依、玻恩、约丹、泡利以及狄拉克的开创性工作的成果。它是一种不确定的、非决定性的、神秘的、描述分子、原子和次原子粒子行为的理论。相反地,经典理论是决定性的,这样,将来总是由过去所完全固定。尽管许多世纪以来对经典物理学的理解使我们得到了非常精确的图像,它仍有许多神秘之处。我们还必须考察量子理论(在第六章)。因为和大多数生理学家的观点相反,我相信量子现象似乎对大脑的运行相当重要的��这些是下面几章的内容。
      迄今为止科学已取得了引人注目的成就。我们只要环视四周即可见证理解自然帮助我们取得了何等伟大的威力。现代世界的技术大多是从大量的经验中推导出来的。然而,正是物理学理论以更基本得多的形式成为我们技术的基础。这正是我们在此所关心的。我们的理论是相当精确的。但其力量并不仅仅在此,而且在于异乎寻常地遵从精密的、微妙的数学处理的这个事实。正是这两者一道为我们带来了威力无比的科学。   这个物理理论的大部分并不特别新颖。如果首先要挑选一个事件的话,那应该是1687年伊萨克·牛顿出版了《原理》一书。这本重要著作向人们展示了,如何仅仅从几个基本的物理原理出发,能够理解并经常以惊人的精度预言了大量的物理对象的行为。《原理》一书中很大部分是关于数学技巧的非凡的发展,尽管欧拉等人后来提供了实用的方法。)正如牛顿所坦率承认的,他自己的工作大大得益于更早期思想家的成果,其中最杰出者为伽利雷·伽利略、雷奈·笛卡尔以及约翰斯·开普勒。还用了一些更古老的思想家们所奠定的重要概念,诸如柏拉图、欧多索斯、欧几里德、阿基米德以及阿波罗纽斯等人的几何概念。我在下面还要更多地说到这些。
      后来出现了对牛顿动力学基本框架的偏离。首先是十九世纪中叶由詹姆斯·马克斯韦发展的电磁理论。这个理论不仅包括了电场和磁场,而且还描述了光的经典行为1!此一杰出的理论将是本章后面所关注的课题。马克斯韦理论对于今天的技术具有相当的重要性,并且毫无疑义地,电磁现象和我们大脑的工作密切相关。然而,和阿尔伯特·爱因斯坦名字联结的两种伟大的相对论对我们的思维过程是否具有任何意义,还没有这么清楚。亨利·彭加莱、亨德里克·安东·洛伦兹以及爱因斯坦为了解释当物体以接近于光速运动时所产生的使人迷惑的行为,从研究马克斯韦方程出发,提出了狭义相对论(后来赫曼·闵可夫斯基给出了精巧的几何描述)。爱因斯坦著名的E=mc2方程是该理论的一部分。但是迄今为止此理论对技术的影响(除了对核物理的效应之外)甚微,看来它和我们头脑工作的关联最多也只是外围的。另一方面,狭义相对论加深了我们对和时间本质有关的物理实体的理解。我们将会在后面几章看到,这给量子理论带来一些根本的迷惑,这些迷惑和我们对“时间流逝”的感觉有重要关系。况且,人们在鉴赏爱因斯坦的广义相对论之前必须理解狭义相对论。广义相对论是用弯曲的空间��时间来描述引力。迄今为止理论对技术的效用几乎是不存在的,看来极端地假设其对我们头脑的功能有何相关真有点异想天开了!然而,值得注意的是,广义相对论的确和我们后面特别是在第七章和第八章的思考关系重大。在那里为了探索要获得量子理论首尾一贯的图像所必须的一些变动,我们要最彻底地研究空间和时间,��这些在后面还要更仔细地讲到!
    经典物理学的领域很广阔。量子物理学的情况又如何呢?和相对论不同的是,量子理论开始剧烈地影响技术。其部分原因在于,它为某些技术上诸如化学和冶金等重要领域提供了理解。人们的确可以讲,正是因为量子理论赋予我们新的详细的洞察力,才使这些领域被包含在物理之中。此外,量子理论还提供了许多全的现象,我想最熟知的例子便是激光。量子理论的某些基本方面会不会在我们的思维过程的物理学中起关键的作用呢?   我们关于更现代的物理学能说些什么呢?一些读者也许会想起那些激动人心的观念,包括诸如“夸克”(参阅177页)。“GUT”(大统一理论)、暴涨宇宙论(参阅402页的注释13)、“超对称”、“(超)弦理论”等等。将这些方案和我刚才提到的那些相比较又如何呢?我们是否也必须通晓这些呢?我相信,为了更清楚地透视,可将基本的物理理论分成三大类。我将这三类命名为:
    1.超等的,
    2.有用的,
    3.尝试的。
      本段之前所讨论的一切理论都必须归于超等类中。我并不强求只有该理论无可辩驳地适用于世界上的一切现象时才能称为超等的。但是,我要求在适当的意义上,该理论适用的范围和精确度必须是显著的。就我所理解的“超等”这个术语而言,居然会有属于这一类的理论存在,这真是极其令人惊异的事!我不知在其他科学中是否有理论可以归入这一类。也许达尔文和瓦拉斯提出的自然选择庶乎近之,但还差得相当远。
      我们在中学学到的欧几里德几何是一种最古老的超等的理论。古代人也许根本不将其当作一种物理理论,但实际上它的确是物理空间以及固体几何的卓越的理论。为何我将欧几里德几何归于物理理论而不是数学的一个分支呢?具有讽刺意义的是,现在我们知道,欧几里德几何不能当作我们实际生活其间的物理空间完全准确的描述,而这是采取这个观点的一个最清楚的原因!爱因斯坦的广义相对论告知我们,在引力场存在时,空间(--时间)实际上是“弯曲的”(也就是说不是完全欧几里德型的)。但是这个事实并没损坏欧几里德几何的超等的资格。在一米的尺度上,与欧几里德的平坦性偏差的确非常微小,它比一个氢原子的直径还小!
      阿基米德,帕波斯和斯蒂文研究静态物体,并将其发展成个漂亮的科学分支--静力学,该理论可以合情合理地够格称作是超等的。现在该理论已被牛顿理论所包容。1600年左右由伽利略提出,并由牛顿将其发展成美丽的、内容丰富的理论的,研究运动物体的动力学的根本观念,应该毫无疑问地纳入超等的范畴。把它应用于行星和月亮的运动时,具有惊人的可观察的精确性--其误差比一千万分之一还小。同一个牛顿的方案也以相当的精确性适用于地球以及外推到恒星和星系的范围。类似地,马克斯韦理论在向内可达到原子和次原子的粒子尺度,向外达到大约大一万亿亿亿亿倍的星系的尺度的异乎寻常的范围内准确地成立!(在此尺度的小的那一端,马克斯韦方程必须和量子力学的规则适当地合并在一起。)它也肯定够格被称作超等的
      爱因斯坦的狭义相对论(为彭加莱所预想并被闵可夫斯基非常精巧地表述)对允许物体以接近光速运动的现象给出了令人惊叹地准确的描述。牛顿的描述最终在这种情况下开始动摇。爱因斯坦的无与伦比漂亮的和开创性的广义相对论推广了牛顿的引力动力学理论并改善了它的精确性,继承了牛顿理论处理行星和月亮运动的所有非凡的成就。此外,它还解释了各种和旧的牛顿方案不一致的观测事实。其中一个例子(参阅242页的双脉卫星的例子)指出爱因斯坦的理论能精确到大约1014分之一。两种相对论--第二种将第一种包含了--应该明确地归到超等的类中去(其数学上的优雅几乎和其准确性一样重要地作为这分类的原因)。
      由不可思议地漂亮的和革命性的量子力学理论所能解释的现象的范围,以及它与实验符合的精度,很清楚地表明它必须归至超等的类中去。迄今尚未找到与该理论在观测上的偏差--然而在用该理论解释许多迄今令人费解的现象方面,显示出其威力远远地超过这些。化学定律、原子的稳定性、光谱线的狭窄(参阅263页)以及非常特别的花样,超导的零电阻的古怪现象以及激光的行为仅仅是其中的几个例子。
      我给超等的分类立下了很高的标准,但这是我们在物理中已经习惯了的。那么,对于最近代的理论能说些什么呢?以我的观点看,恐怕其中只有一种或许够格被称为超等的,并且它还不是特别新的:即是所谓的量子电动力学(或QED)。它是由约丹、海森堡和泡利提出,19261934年间由狄拉克所表述,最终在19471948年间由贝特、费因曼、施温格以及朝永加以改进使之可以应用。这个理论是狄拉克将量子力学、狭义相对论、马克斯韦方程以及制约电子自旋和运动的基本方程结合在一起的结果。总的来说,该理论缺乏早先的许多超等理论的令人信服的精巧和一致性,但它的资格在于真正惊人的准确性。特别值得一提的结果是它给出了电子磁矩的值。(电子的行为类似于一个自旋的电荷的微小磁铁。此处“磁矩”即是这小磁铁的强度。)由QED计算出的这一小磁矩的值为1.00115965246(以某一单位测量--误差大约在最后二位小数上的20),而最近的实验值为1.001159652193(误差大约在最后二位小数上的10)。正如费因曼所指出的,其精确度等效于从纽约到洛杉矶之间相差一根头发的宽度!我们没有必要在此了解该理论。为了完整起见,我将在下一章的结尾简单地提到它的一些重要的特征
      我要将一些现代理论放到有用的范畴中去。有两种理论虽然在这里不需要,却值得提及。第一个是称为强子(质子、中子、介子等等组成原子核--或更准确地讲“强相互作用”的粒子)的次原子粒子的盖尔曼--兹维格夸克模型以及描述它们之间相互作用的详细的(后期的)称为量子色动力学QCD的理论。其思想是,所有强子都由称作“夸克”的部份组成,夸克之间以从马克斯韦理论的某种推广(称为杨--米尔斯理论)的方式进行相互作用。第二种理论是由格拉肖、萨拉姆、瓦尔德和温伯格提出的,它又是利用杨--米尔斯理论将电磁力和描述放射性衰变的“弱”作用结合起来。该理论对所谓的轻子(电子、μ子、中微子;还有WZ粒子--所谓的“弱相互作用”的粒子)作出统一描述。这两种理论有好的实验支持。但是由于种种原因,这些理论远不如人们期望的像QED那么清爽,而且它们目前的观测精度以及预言能力离开超等类的惊人的标准还非常远。有时将这两种理论(第二种还包含QED)称作标准模型
      最后,还有另一种我相信至少可归于有用的范畴的理论。这就是称为宇宙的大爆炸起源的理论。此理论在第七章和第八章的讨论中将起重要的作用。   我认为没有更多的理论属于有用的2范畴。现代(或近代)有许多盛行的观念。它们除了“GUT”理论(以及某些从它导出的观念,诸如“暴涨模型”,参阅402页的注13)外还有:“卡鲁查--克莱因”理论、“超对称”(或“超引力”)以及还极其时髦的“弦”(或“超弦”)理论。以我之见,所有这些都毫无疑义地属于尝试类中。(参阅贝娄1988,克罗斯1983,戴维斯和布朗1988,斯奎尔斯1985)。在有用和尝试类之间的重大差别是后者没有任何有意义的实验支持3。但是这并不是说,其中不会有一个将戏剧性地升格为有用的甚至超等的范畴去的理论。其中某些的确包含有许多相当有前途的、富有创见的思想,但是,可惜迄今仍然没有得到实验的支持,而只停留在观念阶段。尝试类是一个非常宽广的范畴。它们其中有些牵涉到包括能导致新的实质性的理解上的进步的基因,同时我认为其他的一些肯定是误导的或做作的。(我曾经受不了诱惑,试图从可尊敬的尝试类中分出称作误导的的第四类--但是后来我想还是不分的好,因为我不想失去我的一半朋友!)
    超等的理论主要是古代的,人们不必为此感到惊讶。在整个历史上一定有过多得多的归于尝试类的理论,但是多数都被遗忘了。与此相似,许多有用类的理论后来也被湮没了;但是也还有一些被吸收到后来归于超等类的理论中。让我们考虑一些例子。在哥白尼、开普勒和牛顿提出优越得多的方案之前,古希腊人提出过一个十分精巧的行星运动的称作托勒密系统的理论。按照这一方案,行星的运行由圆周运动的复杂组合所制约。它能相当有效地做预言,但是在需要更高的精度时,变得越来越繁复。今天我们看来,托勒密系统的的人为因素显得非常突出。这是一个有用理论(实际上大约用了两千年)后来整个退出物理理论的极好例子,虽然它曾在历史上起超过很重要的组织作用。相反地,开普勒的辉煌的椭圆行星运动的观念便是从有用的理论变成我们能见到的最终成功的例子。化学元素的门捷列夫周期表是另一个例子。它们并没有提供具有“惊人”特征的预言方案,但是后来成为从它们成长出来的超等的理论的“正确”的推论(分别为牛顿动力学和量子理论)。
      在以后的章节中,我不再对仅仅归于有用的尝试的范畴的现代理论多加讨论。因为超等理论已足够讨论的了。我们有这等理论,并能以非常完整的方式理解生活其中的世界,确实是非常幸运的。我们最终必须决定,甚至这些理论是否足够丰富到能制约我们头脑和精神的作用。我将依序触及这些问题;但目前让我们先考虑超等理论并深入思考它们和我们目的相关联之处。
     
    欧几里德几何
     
      欧几里德几何即是我们在中学当作“几何”学习的学科。然而,我预料大部分人会将其视作数学,而不视作物理。当然,它也是数学。但是,欧几里德几何决不是仅有的可以想得出的数学几何。欧几里德传给我们的特殊几何非常精确地描述了我们生活其间的世界的物理空间,但这是逻辑的必然--它仅仅是我们物理世界的(几乎准确的)被观察的特征。
     
    的确还存在另外称作罗巴切夫斯基(或双曲)的几何,它大部分方面非常像欧几里德几何,但还具有一些有趣的差别。例如,我们记得在欧几里德几何中任意三角形的三个角的和为180°。在罗巴切夫斯基几何中,这个和总是比180°小,并且这个差别和三角形的面积成比例(见图5.1)。
      著名的荷兰艺术家毛里兹·C·伊歇为这种几何给出了一种非常精细和准确的表象(见图5.2)。按照罗巴切夫斯基几何,所有的黑鱼具有相同的大小和形状;类似地,白鱼亦是如此。不能将这种几何在通常的欧几里德平面上完全精密地表达出来,所以在圆周边界的内缘显得非常拥挤。想象你自身位于该模型的某一靠近边界的地方,罗巴切夫斯基几何使你觉得就象位于中间或任何其他地方一样。按照这一欧几里德表象,该模型的“边界”正是罗巴切夫斯基几何中的“无穷远”。此处边界圆周根本不应该被看成罗巴切夫斯基空间的一部分--在圆周之外的任何其他的欧几里德区域就更不是了。(这一罗巴切夫斯基平面的天才表象应归功于彭加莱。它卓越的优点在于,非常小的形状在此表象中不被畸变--只不过它的尺度被改变。)该几何中的直线(伊歇鱼就是沿着其中某些直线画出的)即为与边界圆周作直角相交的圆弧。
      我们世界在宇宙学的尺度下,实际上很可能是罗巴切夫斯基空间(参阅第七章376页)。然而,在这种情形下,三角形亏角和它的面积的比例系数必须是极为微小。在通常的尺度下,欧几里德几何是这种几何的极好的近似。事实上正如我们在本章将要看到的,爱因斯坦的广义相对论告诉我们,在比宇宙学尺度小相当多的情形下,我们世界的几何的确与欧几里德几何有偏离(虽然是以一种比罗巴切夫斯基几何更复杂的“更无规”的方式),尽管这偏离在我们直接经验的尺度下仍是极为微小的。
     
    欧几里德几何似乎精确地反映了我们世界“空间”的结构的这一事实,作弄了我们(以及我们的祖先),使我们以为几何是逻辑所必须的,或以为我们有种先天的直觉的领悟,欧几里德几何必须适用于我们在其中生活的世界。(甚至伟大的哲学家伊曼努尔·康德也作此断言。)只有爱因斯坦在许多年以后提出的广义相对论真正地突破了欧几里德几何,欧几里德几何远非逻辑所必须的,它只是该几何如此精确地(虽然不是完全准确地)适合于我们物理空间结构的经验的观测事实!欧几里德几何确实是一个超等物理理论。这是它作为纯粹数学的一部分的精巧性和逻辑性以外的又一个品质。
      在某种意义上,这和柏拉图(约公元前360年;大约在欧几里德著名的《原本》一书出版之前五十年左右)采纳的哲学观点相差不远。依柏拉图观点,纯粹几何的对象��直线、圆周、三角形、平面等等--在实际的物理世界中只能近似地得到实现。而那些纯粹几何在数学上的精确对象居住在一个不同的世界里--数学观念的柏拉图的理想世界中。柏拉图的世界不包括有可感觉的对象,而只包括“数学的东西”。我们不是通过物理的方法,而是通过智慧来和这个世界接触。只要人的头脑沉思于数学真理,用数学推理和直觉去理解,则就和柏拉图世界有了接触。这个理想世界被认为和我们外部经验的物质世界不同,虽然比它更完美,但却是一样地实在。(回顾一下我们在第三章113页和第四章129页关于数学概念的柏拉图实在性的讨论。)这样,可以单纯地用思维来研究欧几里德几何,并由此推导其许多性质,而外部经验的“不完美的”世界不必要刚好符合这些观念。基于当时十分稀少的证据,柏拉图以某种不可思议的洞察力预见到:一方面,必须为数学而研究数学,不能要求它完全精确地适用于物理经验的对象;另一方面,实际的外部世界的运行只有按照精确的数学--亦即“智慧接触得到的”柏拉图理想世界才能最终被理解。
      柏拉图在雅典创建了科学院以推动这种观念。极富影响的著名的哲学家亚里斯多德即为其中之出类拔萃者。但是我们要在这里论及另一位比亚里斯多德名望稍低的科学院成员,即数学家兼天文学家欧多索斯。依我看来,他是一位更优秀得多的科学家,也是古代最伟大的思想家之一。
      欧几里德几何中有一基本的、微妙的并的的确确最重要的部分,那就是实数的引进,虽然今天我们几乎不认为它是几何的(数学家宁愿将它称作“分析”的,而非“几何”的。)因为欧几里德几何研究长度和角度,所以必须了解用何种“数”来描写长度和角度。新观念的核心是在公元前四世纪由欧多索斯(约公元前408至355年)提出的。
      
    几何陷入了“危机”之中(参阅第三章第94页)。将正方形的对角线,以

    定律来研究几何量,将几何测量(比)按照整数(比)来表示是很重要的。欧多索斯的基本思想是提供一种以整数表达长度比例的办法(也就是实数)。他依赖于整数的运算提出了决定一个长度比例是否超过另一个比例,或两者是否完全相等的判据。
      该思想可概述如下:如果a,b,c和d是四个长度,则断定比例a/b大于比例c/d的判据是:存在整数M和N,使得a增大到N倍超过b增大到M倍,而同时d增大到M倍超过c增大到N倍。可用相应的判据来断定a/b是否比c/d小。所寻求的使a/b和c/d相等的判据也就是前两个判据都不能满足!
      直到十九世纪,狄得钦和韦尔斯特拉斯等数学家才发展出完全精确的抽象的实数数学理论。但是他们的步骤和欧多索斯早在22个世纪以前已经发现的思路非常相似!我们在此没有必要描述这个现代发展。在第三章第95页我已给出了这个理论的模糊暗示。但是,为了更容易表达,我宁愿在这里用更熟悉的小数展开的方法来讨论实数理论。(这种展开实际是在 1585年才由斯蒂文引进的。)必须指出,虽然我们很熟悉小数表达方式,但希腊人却对此无知。
     
    然而,在欧多索斯设想和狄德钦--韦尔斯特拉斯设想之间有一个重大差别。古希腊人把实数设想成按照几何量(比)的给定的东西,当作“实际”空间的性质。希腊人用算术来描述几何量是为了要严格地处理这些量以及它们的和与积--亦即古人这么许多美妙几何定理的要素的先决条件。(我在图5.3画出并解释了杰出的托勒密定理--虽然托勒密比欧多索斯要晚许久才发现它--该定理和一个圆周上的四点之间的距离相关,它很清楚地表明了和与积都是需要的。)历史证明欧多索斯判据极其富有成果,尤其是它使希腊人能严格地计算面积和体积。
      然而,对于十九世纪尤其是当代的数学家而言,几何的作用已被改变了。古希腊人,尤其是欧多索斯,认为“实”数是从物理空间的几何中抽取出来的东西。现在我们宁愿认为在逻辑上实数比几何更基本。这样的做法还可以允许我们建立所有不同种类的几何,每一种几何都是从数的概念出发。(其关键的思想是十六世纪由费马和笛卡尔引进的座标几何。座标可用来定义其他种类的几何。)任何这种“几何”必须是逻辑协调的,但不必和我们经验的物理空间有任何直接的关联。我们似乎感知的特别物理几何是经验的理想化(例如,依赖于我们将其向无限大或无限小尺度的外推,参阅第三章第99页)。但是现代的实验已足够精密,以至于我们必须接受“经验的”几何的确和欧几里德观念有差别的这一事实(参阅242页)。这种经验和从爱因斯坦广义相对论推导的结果相一致。然而,尽管我们的物理世界的几何观点起了变化,欧多索斯二十三世纪之久的实数概念在实质上并没有改变。它对爱因斯坦理论正如对欧几里德理论一样重要。其实,迄今为止它仍然是一切严肃物理理论的重要部分。
      欧几里德的《原本》的第五部基本上是关于欧多索斯“比例论”的阐述。这对整本书而言是极为重要的。全书首版于公元前300年的《原本》的确必须列为有史以来最具深远影响的著作之一。它成为后来的几乎所有科学和数学思想的舞台。它全部是由一些被认为空间的“自明”性质,亦即清楚叙述的公理出发演绎而来,其中许多重要推论根本不是显而易见的,而是令人惊异的。无疑地,欧几里德的著作对后世科学思想的发展具有深刻的意义。
      阿基米德(公元前287--212)无疑是古代最伟大的数学家。他天才地利用欧多索斯的比例论,计算出诸如球体,或者更复杂地牵涉到抛物线和螺线的许多不同形体的面积和体积。今天我们可以用微积分十分容易地做到这些。但是我们要知道,这是比牛顿和莱布尼兹最终发现微积分早十九世纪的事!(人们可以说,阿基米德已经通晓微积分的那一多半--亦即积分的那一半!)阿基米德的论证,甚至以现代的标准看,也是毫无瑕疵的。他的写作深深地影响许多后代的数学家和科学家,最明显的是伽利略和牛顿。阿基米德还提出了静力学的(超等的?)物理理论(亦即制约平衡的物体,诸如杠杆和浮体的定律)。他用类似于欧几里德发展几何空间和固体几何的科学方法,将其发展成演绎的科学。
      阿波罗纽斯(约公元前262--200)是我必须提及的一位阿基米德的同时代人。他是一位具有深刻洞察力的、伟大的、天才的几何学家。他关于圆锥截线(椭圆、抛物线和双曲线)的研究极大地影响了开普勒和牛顿。令人惊异的是,这些截线的形状刚好是描述行星轨道所必须的!
     
    伽利略---牛顿动力学
     
      对运动的理解是十七世纪科学的根本突破。古希腊人对静态的物理--刚性的几何形状或处于平衡的物体(此时所有的力都平衡,因而没有运动)理解得很透彻。但是他们对制约实际运动的物体的定律并没有很好的概念。他们所缺少的是一个好的动力学理论,亦即自然实际上控制物体的位置从第一时刻到下一时刻变化的完美方式的理论。其部分原因(绝非全部)则是没有测量时间的足够精密的手段,亦即没有相当好的“钟表”。为了给位置变化定时以及确定物体的速度和加速度,人们必须有钟表。因此1583年伽利略观察到摆能作为计时的可靠手段的这个事件对他(甚至对整个科学!)极具重要性,因为这样一来运动的计时就变准确了4。随着55年后的1638年伽利略《对话》一书的出版诞生了新的学科--动力学--开始了从古代神秘主义到现代科学的转化!
     
      让我仅仅列举伽利略提出的个最重要的物理观念。第一是作用在物体上的力决定的是它的加速度,而不是速度。此处“加速度”和“速度”的含意是什么呢?粒子--或物体上的某点--的速度是该点位置相对于时间的变化率,速度通常是一个矢量,亦即必须同时考虑其方向大小的量(否则我们用“速率”这一术语,见图5.4)。加速度(又是一个矢量)是速度相对于时间的变化率--这样加速度实际上是位置相对于时间的变化率的变化率!(这对于古人来说实在太难为了!他们既缺乏可胜任的“钟表”,又不具备与变化率相关的数学概念。)伽利略断言,作用在物体的力(在他的情形下是指重力)制约物体的加速度,而直接制约其速度--正和古代人例如(亚里斯多德)所相信的不一样。
      特别是当不存在外力时,速度必须是常数--因此,在直线上作的恒常运动应是没有外力作用的结果(牛顿第一定律)。自由运动着的物体继续其匀速运动,而不必施加外力去维持它。伽利略和牛顿发展的动力学定律的一个推论是,直线匀速运动和静止状态亦即不运动在物理上完全不可区分:不存在一种局部的方法,将匀速运动从静止中区别开来!伽利略关于这点特别清楚(甚至比牛顿还清楚)。他以海上的航船作例子对此作了非常形象的描绘(参阅德拉克1953186187页):
     
    把你和某位朋友关在某艘大船的甲板下的主舱里,和你一道的还有一些苍蝇、蝴蝶和其他飞行动物。一些鱼在一大碗水中自由自在地游着;水一滴一滴从悬挂着的瓶子落到下面的一个大器皿里。当船静止时,仔细观察这些小动物如何以同样的速率向船舱的所有方向飞行。鱼儿不辨方向地游着,水滴落到下面的器皿中;……在仔细地观察了这一切以后……让船以你想要的速度行驶。只要其运行是均匀的、并且不让它作这样那样的摇动,你就会发现,不但所有提及的现象没有丝毫变化,而且你根本就不知道船是在行驶,还是在静止不动……正如早先那样,小水滴落到下面的器皿中去,而不向船尾的方向飘去,虽然就在水滴在空气中的时间间隔里,船已经向前走了船身长度好几倍的距离。水中的鱼向前游动并不比向后更费动,同样轻松地向放在碗的任何方向的边缘上的鱼饵游去。还有,蝴蝶和苍蝇毫无异样地继续飞向四方。似乎它们为了避免落后,在空中随着船作长途旅行后感到疲劳,最后聚集到船尾的现象从未发生过!
     
      这个被称为伽利略相对论原理的惊人事实,在使哥白尼观点具有动力学意义上十分关键。尼古拉·哥白尼(1473--1543)(以及古希腊天文学家亚里斯塔哥斯(约公元前310--230)--不要和亚里斯多德相混淆!��比他早十八世纪)提出了日心说,即太阳处于静止状态,而地球在沿自己的轴自转的同时绕着太阳公转,公转速度为每小时十万公里。为何我们没有感觉到这种运动?在伽利略提出动力学理论之前,这的确是哥白尼观点的深深的困惑。如果更早先的“亚里斯多德式”的动力学观点是正确的话,即在空间中运动的系统的实在速度要影响其动力学行为,那么地球的运动对我们就会有直接明显的效应。伽利略相对论弄清了,何以地球在运动,而同时我们却不能直接感觉到它的原因
      值得指出的是,在伽利略相对论中,“静止”的概念并无任何局部上的意义。它对人类的空间--时间观念已经具有显著的含义。我们直观的空间--时间图像是,“空间”构成了物理事件在其中发生的舞台。物理对象在某一时刻可处于空间的某一点,在后一时刻可处于同一个,或另一个不同的空间的点。我们想象空间中的点可以从一个时刻维持到另一个时刻。这样,一个物体实际上是否改变其空间位置的说法就具有意义。但是,伽利略相对论指出,不存在“静止状态”的绝对意义;所以,“在不同时间的空间的同一点”的说法是毫无意义的。某一时刻的物理经验的欧几里德三维空间的哪一点是我们的欧几里德三维空间另一时刻的“同一点”呢?没有办法找到。对应于每一时刻我们似乎必须有一个完全“新”的欧几里德空间!考虑具有物理实在性的四维空间--时间图就会使这一层意思明了(见图5.5)。不同时刻的三维欧几里德空间的确被分开,但所有这些空间合并在一起构成了完整的四维的空间--时间图。在空间--时间中进行匀速直线运动的粒子的历史是一条直线(称为世界线)。以后在讨论爱因斯坦相对论时我还会回到空间��时间以及运动的相对性的问题上来。我们将发现在那种情形下对四维维数的论证会更加有力。
     
     
    伽利略的第三个伟大洞察是开始理解能量守恒。伽利略主要关心物体在重力下的运动。他注意到,如果从一静止状态释放一个物体,则不管它是简单地落下,还是随一个任意长度的摆振动,或是沿着一个光滑斜面滑下,其速率依赖于它从释放之处下落的垂直距离。正如我们现在所说的,储存于超过地面的高度的能量(引力势能)会转换成它的运动的能(只依赖于物体速率的动能)。反之亦然,但总能量既不损失也不增加。
    能量守恒定律是一个非常重要的物理原则。它不是物理学的一个独立要求,而是我们很快就要讨论的牛顿动力学定律的推论。笛卡尔、惠更斯、莱布尼兹、欧拉以及开尔芬等人几个世纪来的努力,使这一定律的表述越发清晰。在本章的后部以及第七章,我们将要再回到这个问题上来。如果把能量守恒定律和伽利略的相对论原理相结合,我们就能得到更多的相当重要的守恒定律:质量和动量守恒。粒子的动量是它的质量和速度的乘积。火箭的推进即是动量守恒的众所周知的例子之一,火箭往前动量的增加恰好和(更轻的、但是更急速的)废气往后的动量相平衡。枪的后座力也是动量守恒的一个表现形式。牛顿定律的进一步推论是角动量守恒,角动量守恒是描写一个系统的自旋的不变性,地球绕自己的轴自旋以及网球的自旋都是依靠它们的角动量守恒来维持的。组成任何物体的每一个粒子都对该物体的总角动量有贡献,这贡献等于它的动量与它离开中心的垂直距离的乘积。(自旋转物体只要变紧凑,其角速度就会增加,即是其中的一个推论。滑冰者和马戏团高架秋千艺术家经常表演的令人惊叹而熟悉的动作也起源于此。他们经常利用收回手臂或腿的动作使旋转速度自动增加。)在后面的内容中我们将会看到质量、能量、动量以及角动量都是重要的概念。
      最后,我应该让读者回顾一下伽利略的先知的洞察力,那就是当大气摩擦力不存在的时候,在重力作用下所有物体都以同一速率下落。(读者也许会回想起他从比萨斜塔上同时释放不同物体的著名故事,)三个世纪以后,正是这一个洞察导致爱因斯坦将其相对论原理推广到加速参考系统,从而为他的非凡的引力的广义相对论提供了基石,这在本章的结尾处将会看到。
      
      在伽利略的创立的令人印象深刻的基础上,牛顿建立了绝顶庄严华美的大教堂。牛顿指出了物体行为的定律。第一和第二定律基本上是伽利略给出的:如果没有外力作用到一个物体上,则物体将继续其直线匀速运动;如果有外力作用到上面,则物体的质量乘以它的加速度(亦即其动量变化率)等于这个力。牛顿本人的一个特殊的洞察,在于意识到还需要第三定律:物体A作用在物体B上的力,刚好和物体B作用到物体A上的力大小一样而方向相反(“每一个作用必有其大小一样方向相向的反作用”)。这就提供了基本的框架。“牛顿宇宙”是由在服从欧几里德几何定律的空间中运动的粒子所组成。作用到这些粒子上的力决定了他们的加速度。每一个粒子所受的力是由所有其他粒子分别贡献到该粒子的力利用矢量加法定律相加而得到(见图5.6)。为了很好地定义这个系统需要一些规则,这些规则可以告诉我们从另一个粒子B作用到粒子A的力是什么样子的。通常我们需要该力沿着AB之间的连线作用(见图5.7)。如果该力是引力,则AB之间的力是互相吸引的,其强度和它们质量乘积成正比,而和它们之间的距离的平方成反比:亦即反平方律。对于其他种类的力,其依赖于位置的方式可与此不同,也可能决定于粒子质量以外的其他性质。
      伽利略的一位同时代人,伟大的约翰斯·开普勒(1571--1630)注意到,行星绕太阳公转的轨道是椭圆而不是圆周(太阳总是处于该椭圆的一个焦点上,而不在其中心)。他还给出了制约行星作此椭圆运动的速率的其他两个定律。牛顿能够从他自己的一般理论(以及引力的反平方律)推导出开普勒三定律。不仅如此,他还对开普勒的椭圆轨道作了各种细节上的修正,诸如春秋分日点的进动(许多世纪以前的希腊人已注意到这些地球旋转轴方向的这种极慢的运动)。为了取得所有这些成就,牛顿就必须发展除了微积分之外的许多数学手段。他惊人的成就得大大归功于其超等的数学技巧及其同等超人的物理洞察力。
     
    牛顿动力学的机械论世界
     
      如果已知特定的力的定律(例如引力的反平方律),则牛顿理论就表达成一组精密的确定的动力学方程。如果各个粒子在某一个时刻的位置、速度和质量是给定的,则它们随后任何时间的位置、速度(以及质量--这被当作常数)就被数学地确定,这种牛顿力学的世界所满足的决定论形式对哲学思维产生了(并正在产生着)深远的影响。让我们更仔细地考察牛顿的决定论。它对“自由意志”有何含义呢?一个严格的牛顿世界能包含精神吗?甚至牛顿世界能包含计算机器吗?   让我们先明确一下什么是世界的“牛顿”模型。例如,我们可以认为组成物体的所有粒子是数学的、亦即没有尺度的点。另外的办法是将它们当作球状的刚性球。无论如何,我们都必须假定知道力的定律,例如,牛顿引力论中的引力的反平方律。我们还要对自然的其他力,比如电力磁力(威廉·吉尔伯特在1600年首先仔细研究过)以及现代已知将粒子(质子和中子)绑在一起形成原子核的强核力的定律也表述出来。电力正和引力一样满足反平方律,但类似的粒子互相排斥(而不像引力那样互相吸引)。这里不是粒子的质量,而是它们的电荷决定它们之间电力的强度。磁力和电力一样也是“反平方的”,但是核力以相当不同的形式随距离而变化。在原子核中当粒子相互靠得紧密时核力极大,而在更大距离下则可以忽略不计。
      假定我们采用刚体圆球的模型,并要求两个球碰撞时,它们即完全弹性地反弹。也就是说,它们如同两个完好的撞球那样,在能量(或总动量)没有损失的情况下分离开。我们还必须明确指明两球之间的作用力。为了简单起见,我们可以假定任两球之间的作用力都沿着它们中心的连线,其大小为该连线长度的给定的函数。(由于牛顿的一个出色的定理,此假设对牛顿引力自动成立。对其他力的定律,这可当成一个协调的要求而加上的条件。)如果刚体只进行成对碰撞,而不发生三个或更多个的碰撞,则一切都定义得很好,而且结果会连续地依赖于初始条件(亦即只要初态的变动足够小,财能保证结果变化也很小)。斜飞碰撞的行为是两球刚好相互错过的行为的连续过渡。但在三球或多球碰撞的情形下就产生了新问题。例如,如果三球ABC一下子跑到一块,那AB先碰撞,紧接着CB碰撞,或AC先碰撞,紧接着BA碰撞,情况就很不一样(见图5.8)。在我们的模型中,只要有三碰撞发生就存在非决定性!只要我们愿意,就可以用“极不可能”的理由简单地将三碰撞或多碰撞的情形排除掉。这就提供了一种相当一致的方案,但三碰撞的潜在问题表明终态将以连续的方式依赖于初态。
     
     
    这有点使人不满意,我们也许会更喜欢粒子的图像。但是,为了避免某些点粒子模型引起的理论困难(当两个粒子撞到一起时出现的无限大力和无限大能量),人们必须做其他假设,诸如在短距离时粒子的相互作用力变成非常强的排斥力等等。在这种情形下,我们可以保证任何一对粒子实际上都不会碰撞到一起。(这也使我们避免了它们碰撞时的点粒子如何行为的问题!)然而,为了直观起见,我宁愿完全按照刚球模型来讨论。看来这种“撞球”图像正是大多数人下意识的实体的模型。
      牛顿5撞球的实体模型(不管多碰撞问题)确实是一个决定论模型。此处“决定论”的含义是:所有球(为了避免某些麻烦,假定为有限个)在将来(或过去)的物理行为数学地被某一时刻的位置和速度所完全决定。这样看来,在这个撞球的世界上根本没有余地让“精神”用“自由意志”的行动去影响物体的行为。我们如果还信仰“自由意志”的话,就要被迫对实际世界的如此构成方式提出质疑。
      这个令人烦恼的“自由意志”问题一直徘徊在这整部书的背景里--虽然在多数情况下,我必须说只在背景里。在本章后头有一个很小却很奇特的地方牵涉到它(关于相对论中超光速讯号传递的问题)。我将在第十章直接着手自由意志的问题。读者一定会对我的结果深感失望。我的确相信,这里存在一个真正的、而非想象的问题。但它是非常根本的,并且要把它表述清晰非常困难。物理理论中的决定论是一个非常重要的问题,但是我相信这只是问题的一部分。例如,这个世界很可能是决定性的,但同时却是不可计算的。这样,未来也许以一种在原则上不能计算的方式被现在所决定。我将在第十章论证,我们具有意识的头脑的行为的确是非算法的(亦即不可计算的)。相应地,我们自信所具备的自由意志就必然和制约我们在其中生活的世界的定律中某些不可计算部分紧密地纠缠在一起。是否接受这样的关于自由意志的观点,亦即给定的物理(例如牛顿)理论,是否的确是可计算的,而不仅仅是否是决定性的,是一个有趣的问题。可计算性不同于决定性--这正是我试图在本书所要强调的。
     
    撞球世界中的生活是可计算的吗?
     
      我现在使用一个决定性的、但不可计算的“玩具宇宙模型”,来解释可计算性和决定性不同的。我承认这是一个人为的特别例子。宇宙任何“时刻”的“态”可用一对自然数(mn)来表示。用Tu表示一台固定的普适图灵机,譬如在第二章(63页)定义的那一台。为了决定下一“时刻”宇宙的态,我们必须知道Tum上的作用最终停止不或不停(亦即用第二章65页的记号,Tum)≠□还是Tum=□成立)。如果它停止,则下一时刻的态为(m+1n)。如果它不停止,则为(n+1m)。从第二章我们知道,不存在图灵机停止问题的算法。这样就不存在去预言这个模型宇宙“将来”的算法,尽管它是完全决定性的6
      当然,这不能认为是一个严肃的模型。但它表明存在一个要回答的问题。我们可对任何决定性的物理理论考察其可计算性。那么,牛顿的撞球世界究竟是否可计算的呢?   物理可计算性的问题部分地依赖于我们打算对此系统问哪一种问题。在牛顿撞球模型中,我能想到一些可以问的问题,我对这些问题的猜测是,要弄清其答案不是一个可计算(亦即算法的)事体。球A和球B究竟会碰撞否便是这样的一个问题。其思路是,在某一特定时刻(t=O)所有球的位置和速度作为初始数据给定后,我们要知道,AB是否会在将来的任一时刻(tO)碰撞?为使这个问题更明确(虽然不是特别现实),我们可以假定,所有球的半径和质量都一样,并且每一对球之间的作用力是反平方律的。我之所以猜想这是非算法可解的问题的一个原因是,该模型有点像爱德华·弗列得钦和托马索·托弗里在1982年提出的“计算的撞球模型”。在他们的模型中,球被若干堵“墙”所限制(而不是反平方律的力);但是它们互相以类似于我刚描述过的牛顿球那样弹性反弹(见图5.9)。在弗列得钦--托弗里模型中,所有电脑的基本逻辑运算都可由球来实现。我们可以模拟图灵机的任何计算:对图灵机Tu的特别选取规定了弗列得钦��托弗里机器的“墙”等等的搭配;运动的球的初态可认为是输入磁带的信息的码,将球的终态解码就得到图灵机输出磁带的信息。这样一来,人们会特别关心这样一个问题:如此这般的图灵机会有停止之时吗?“停止”的是意味着球A最终和球B碰撞。我们已知这个问题不能用算法回答(71页),这事实至少暗示我前面提出的“球A最终和球B碰撞吗?”的牛顿问题也不能用算法回答。
      事实上,牛顿问题比弗列得钦和托弗里提出的问题要棘手得多,后者可依照分立变数(亦即按照诸如“球或者在通道上或者不在”的“在或不在”的陈述)来指明其状态。但在完整的牛顿问题中必须以无限的精度,按照实数的座标而不是以分立的方式指明球的初始位置和速度。这样,我们又面临着在第四章处理关于孟德勒伯洛特集是否可递归的问题时所必须考虑的所有麻烦。当允许输入和输出数据为连续变化的变数时“可计算性”的含义是什么呢7?我们可以暂时假定所有初始位置和速度座标均为有理数(虽然不能预料在t的时刻以后的有理数仍保持为有理数),而使此问题变得稍为缓和。我们知道有理数为两整数的比,所以为一可列集。我们可用有理数来任意地逼近所选择用来考察的任何初始数据了。对于有理数的初始数据,也许不存在决定AB是否最终会碰撞的算法的猜测决不是毫无道理的。
     
    然而,这并不是诸如“牛顿撞球世界是不可计算的”断言的真正含义。我用来和我们的牛顿撞球世界作比较的弗列得钦--托弗里“撞球电脑”的特殊模型的确按照计算而进行。无论如何,这是弗列得钦和托弗里思想的基本点--他们模型的行为应该和一台(普适)电脑一样!我试图要提的问题是,在某种意义上,人类大脑驾驭适当的“不可计算的”物理定律,能比图灵机做得更好,这一点是不是可以理喻的。追究如下的问题将是徒劳的:
      “如果球A永远碰不到球B,则你的问题的答案为‘非’。”
      人们可能永远也等待不到断定问题中的球不会碰到一起的时刻!那当然正是图灵机行为的方式。   事实似乎很清楚地表明,牛顿撞球世界在某个合适的意义上(至少在如果我们不管多碰撞的问题之时)可计算的。人们通常计算这种行为的方法是做一些近似。我们可以想象这些球的中心被指定在点的网格上,譬如讲网格的点被划分到百分之几单位。时间也被认为是“分立”的,所有可允许的时刻是某一小单位(用△t表示)的倍数。这就产生了一定的“速度”的可允许的分立值(两个连续允许的格点的位置的座标值的差,除以△t)。利用力的定律来计算加速度的适当的近似,再利用它使“速度”并因此下一允许时刻的新的格点位置被确定到所需要的近似程度。只要我们能维持所需的精度,则这种计算就可一直进行下去。很有可能算不了多少次其精度就失去了。以后的步骤是从更细的空间分格,以及更细的时间间隔重新开始。这一回能得到更好的精度,并在精度损失之前能计算到更久的将来的某一时刻。不断地增加细度,则计算的精度和所到达的将来的时间的长度就能不断地改进。可用这种方法将牛顿撞球世界计算到任意高的精度(不管多碰撞的问题)--我们可以在这种意义上讲牛顿世界的确是可计算的。
      然而,认为这一个世界在实际上是“不可计算的”断言是具有某种含义的。这是因为得知的初始数据的精度总是受限制的。这类问题的确存在着固有的不可忽视的“不稳定性”。初始数据的极为微小的改变会导致结果行为的绝大的变化。(任何玩撞球的人,在他想用一个球去撞另一个使之落入球囊时,都知道我这样说的意思!)这在(连续)碰撞发生时尤其明显。但是,这种不稳定性行为也会发生在牛顿的引力远距离作用时(多于两体的情况下)。所谓的“混沌”或“混沌行为”经常用来表示这种不稳定的类型。例如,混沌行为对天气影响重大。虽然我们对控制基本元素的牛顿方程式了解甚多,但是远期天气预报之不可靠性则是臭名昭彰的!
      这根本不是那类可以任何方式驾驭的“不可计算性”。这只是因为所知的初始态的精度有限,而终态不能由初态可靠地算出。实际上只是随机因素被引入到未来的行为中而已。如果大脑的确使用了物理定律中的不可计算性的有用的因素,则它们必须具有完全不同的、并从这里引出更正面得多的特性。相应地,我根本不把这种“混沌”行为称为“不可计算性”,而将其称为“不可预见性”。正如我们很快就会看到的,在(经典)物理学中的决定性的定律中存在不可预见性,是一种非常一般的现象。在制造思维机器时,不可预见性正是我们希望尽量减小而不是去“驾驭”的东西!
      为了更一般地讨论可计算性和不可预见性的问题,对物理定律采用比以前更广泛的观点将会更有助。这就促使我们不仅只考虑牛顿力学的理论,而且研究随后超越过它的各种理论。我们需要领略力学的美妙的哈密顿形式。
    哈密顿力学
     
    牛顿力学不仅在于非凡地应用到物理世界方面,而且在于它所引起的数学理论的丰富方面取得瞩目的成功。令人惊异的是,自然界所有超等理论都被证明是数学观念的丰富来源。这些绝顶精确的理论就作为数学而言也是极富成果的,这个事实具有一种深刻和美丽的神秘。它毫无疑问地表明,在我们经验的实在世界和柏拉图的数学世界之间有某种根本的关联。(我将在第十章495页再讨论这一些。)牛顿力学也许是这方面的一个顶峰,因为它一诞生即获得了微积分。而且,牛顿理论形成了非凡的称为经典力学的数学观念的实体。十八和十九世纪许多伟大数学家的名字都和此发展相关联:欧拉、拉格朗日、拉普拉斯、刘维尔、泊阿松、雅科比、奥斯特洛夫斯基、哈密顿。被称为“哈密顿理论”8的即为这一工作的总结。为了我们的目的对其稍微了解即可以了。威廉姆·罗曼·哈密顿(1805--1865)是一位多才多艺和富有创见的爱尔兰数学家,他还是在165页讨论过的哈密顿线路的发明者。他把力学发展成强调其与波传播相类似的形式。波和粒子的关系的暗示,以及哈密顿方程的形式对于后来的量子力学的发展极为重要。我在下一章还会提及。
      用以描述物理系统的“变量”是哈密顿理论的一个奇妙的部分。迄今为止,我们一直把粒子的位置当作基本的,而速度作为位置对时间的变化率。我们记得在牛顿系统中为了确定随后的行为,必须指定初始态(192页),也就是需要所有粒子的位置速度。在哈密顿形式中,我们必须挑选粒子的动量,而不是速度。(我们在190页提到粒子动量是速度和质量的乘积。)这种改变似乎很微不足道,但是重要的在于每一粒子的位置和动量似乎被当作独立的量来处理。这样,人们首先“假装”不同粒子的动量和它所对应的位置的改变率没有什么关系,而仅仅是一组分开的变量。我们可以想像它们“可以”完全独立于位置的运动。现在在哈密顿形式中我们有族方程。有一族告诉我们不同粒子的动量如何随时间变化,另一族告诉我们位置如何随时间变化。在每一种情况下,变化率总是由该时刻的不同位置和动量所决定。
      粗略地讲,第一族哈密顿方程表述了牛顿的关键的第二运动定律(动量变化率=力),而第二族方程告诉我们动量实际上即是依赖于速度(位置变化率=动量÷质量)。我们记得,伽利略--牛顿的运动定律是用加速度,即位置变化率之变化率(亦即“二阶”方程)来描述。现在,我们只需要讲到事物的变化率(“一阶”方程),而不是事物变化率的变化率。所有这些方程都是从一个重要的量推导而来:哈密顿函数H,它是系统的总能量按照所有位置和动量变量的表达式。
      哈密顿形式提供了一种非常优雅而对称的力学描述,我们在下面写出这些方程,仅仅是为了看看它们是什么样子的。虽然,甚至许多读者并不熟悉完全理解之所必须的微积分记号--它在这里是不需要的。就微积分而言,所有我们真正要理解的是,出现在每一个方程左边的点表示(在第一种情况下,动量的;在第二种情况下,位置的)对时间的变化率
      这里下标i用以区别所有不同的动量座标p1p2p3p4,…和所有不同的位置座标x1x2x3x4,…。n个不受限制的粒子具有3n个动量座标和3n个位置座标(每一个代表空间中的三个独立的方向)。符号表示“偏微分”(“在保持其他变量为常数的情况下取导数”)。正如前述的,H为哈密顿函数。(如果你不通晓“微分”,不必担心。只要认为这些方程的右边是某些定义完好的,以xipi来表达的数学式子就行了。)
      在实际上,座标x1x2,…和p1p2,…可允许为某种比粒子通常的笛卡尔座标(亦即xi为通常的沿三个不同的相互垂直的方向测量的距离)更一般的东西。例如座标xi中的一些可以是角度(在这种情形下,相应的pi就是动量,而不是动量,参见190页),或其他某些完全一般的测度。令人惊异的是,哈密顿方程的形状仍然完全一样。事实上,合适地选取H,哈密顿形式不仅仅是对于牛顿方程,而且对任何经典方程的系统仍然成立。对于我们很快就要讨论的马克斯韦(--洛伦兹)理论,这一点尤其成立。哈密顿方程在狭义相对论中也成立。如果仔细一些,则广义相对论甚至也可并入到哈密顿框架中来。此外,我们将要看到在薛定谔方程332页)中,哈密顿框架为量子力学提供了出发点。尽管一世纪以来 
      构的形式却是如此地统一,这真是令人惊叹!
     
    相空间
     
      哈密顿方程的形式允许我们以一种非常强而有力的一般方式去“摹想”经典系统的演化。想象一个多维“空间”,每一维对应于一个座标x1,x2,…p1p2,…(数学空间的维数,通常比3大得多。)此空间称之为相空间(见图5.10)。对于n个无约束的粒子。相空间就有6n维(每个粒子有三个位置座标和三个动量座标)。读者或许会担心,甚至只要有一个单独粒子,其维数就是他或她通常所能摹想的二倍!不必为此沮丧!尽管六维的确是比能明了画出的更多的维数,但是即使我们真的把它画出也无太多用处。仅仅就一满屋子的气体,其相空间的维数大约就有
      10 000 000 000 000000000000 000 000
      去准确地摹想这么大的空间是没有什么希望的!既然这样,秘诀是甚至对于一个粒子的相空间都不企图去这样做。只要想想某种含糊的三维(或者甚至就只有二维)的区域,再看看图5.10就可以了。
     
      我们如何按照相空间来摹想哈密顿方程呢?首先,我们要记住相空间的单独的点Q实际代表什么。它代表所有位置座标x1x2,…和所有动量座标p1p2,…的一种特别的值。也就是说,Q表示我们整个物理系统,指明组成它的所有单独粒子的特定的运动状态。当我们知道它们现在的值时,哈密顿方程告诉我们所有这些座标的变化率是多少;亦即它控制所有单独的粒子如何移动。翻译成相空间语言,该方程告诉我们,如果给定单独的点Q在相空间的现在位置的话,它将会如何移动。为了描述我们整个系统随时间的变化,我们在相空间的每一点都有一个小箭头��更准确地讲,一个矢量��它告诉我们Q移动的方式。这整体箭头的排列构成了所谓的矢量场(图5.11)。哈密顿方程就这样地在相空间中定义了一个矢量场。
      我们看看如何按照相空间来解释物理的决定论。对于时间t=0的初始数据,我们有了一族指明所有位置和动量座标的特定值;也就是说,我们在相空间特别选定了一点Q。为了找出此系统随时间的变化,我们就跟着箭头走好了,这样,不管一个系统如何复杂,该系统随时间的整个演化在相空间中仅仅被描述成一点沿着它所遭遇到的特定的箭头移动。我们可以认为箭头为点Q在相空间的“速度”。“长”的箭头表明Q移动得快,而“短”的箭头表明Q的运动停滞。只要看看Q以这种方式随着箭头在时间t移动到何处,即能知道我们物理系统在该时刻的状态。很清楚,这是一个决定性的过程。Q移动的方式由哈密顿矢量场所完全决定。
     
      关于可计算性又如何呢?如果我们从相空间中的一个可计算的点(亦即从一个其位置和动量座标都为可计算数的点,参阅第三章95页)出发,并且等待可计算的时间t,那么一定会终结于从t和初始数据计算得出的某一点吗?答案肯定是依赖于哈密顿函数H的选择。实际上,在H中会出现一些物理常数,诸如牛顿的引力常数或光速--这些量的准确值视单位的选定而被决定,但其他的量可以是纯粹数字--并且,如果人们希望得到肯定答案的话,则必须保证这些常数是可计算的数。如果假定是这种情形,那我的猜想是,答案会是肯定的。这仅仅一个猜测。然而,这是一个有趣的问题,我希望以后能进一步考察之。
      另一方面,由于类似于我在讨论有关撞球世界时简要提出的理由,对我来说,这似乎不完全是相关的问题。为了使一个相空间的点是不可计算的断言有意义,它要求无限精确的座标��亦即它的所有小数位!(一个由有限小数描述的数总是可以计算的。)一个数的小数展开的有限段不能告诉我们任何关于这个数整个展开的可计算性。但是,所有物理测量的精度都是有限的,只能给出有限位小数点的信息。在进行物理测量时,这是否使“可计算数”的整个概念化成泡影?”
      的确,一个以任何有用的方式利用某些物理定律中(假想的)不可计算因素的仪器不应依赖于无限精确的测量。也许我在这里有些过分苛刻了。假定我们有一台物理仪器,为了已知的理论原因,模拟某种有趣的非算法的数学过程。如果此仪器的行为总可以被精密地确定的话,则它的行为就会给一系列数学上有趣的没有算法的(像在第四章中考虑过的那些)是非问题以正确答案。任何给定的算法都会到某个阶段失效。而在那个阶段,该仪器会告诉我们某些新的东西。该仪器也许的确能把某些物理常数测量到越来越高的精度。而为了研究一系列越来越深入的问题,这是需要的。然而,在该仪器的有限的精度阶段,至少直到我们对这系列问题找到一个改善的算法之前,我们得到某些新的东西。然而,为了得到某些使用改善了的算法也不能告诉我们的东西,就必须乞求更高的精度。
      尽管如此,不断提高物理常数的精度看来仍是一个棘手和不尽人意的信息编码的方法。以一种分立(或“数字”)形式得到信息则好得多。如果考察越来越多的分立单元,也可重复考察分立单元的固定集合,使得所需的无限的信息散开在越来越长的时间间隔里,因此能够回答越来越深入的问题。(我们可以将这些分立单元想象成由许多部分组成,每一部分有“开”和“关”两种状态,正如在第二章描述的图灵机的01状态一样。)为此看来我们需要某种仪器,它能够(可区别地)接纳分立态,并在系统按照动力学定律演化后,又能再次接纳一个分立态集合中的一个态。如果事情是这样的话,则我们可以不必在任意高的精度上考察每一台仪器。
      那么,哈密顿系统的行为确实如此吗?某种行为的稳定性是必须的,这样才能清晰地确定我们的仪器实际上处于何种分立态。一旦它处于某状态,我们就要它停在那里(至少一段相当长的时间),并且不能从此状态滑到另一状态。不但如此,如果该系统不是很准确地到达这些状态,我们不要让这种不准确性累积起来;我们十分需要这种不准确性随时间越变越小。我们现在设想的仪器必须由粒子(或其他子元件)所构成。需要以连续参数来描述粒子,而每一个可区别的“分立”态复盖连续参数的某个范围。(例如,让粒子停留在二个盒子中的一个便是一种表达分立双态的方法。为了指明该粒子确实是在某一个盒子中,我们必须断定其位置座标在某个范围之内。)用相空间的语言讲,这表明我们的每一个“分立”的态必须对应于相空间的一个“区域”,同一区域的相空间点就对应于我们仪器的这些可选择的同一态(图5.12)。
     

      现在假定仪器在开始时的态对应于它的相空间中的某一个范围R0。我们想象R0随着时间沿着哈密顿矢量场被拖动,到时刻t该区域变成Rt。在画图时,我们同时想象对应于同一选择的所有可能的态的时间演化(见图5.13)。关于稳定性的问题(在我们感兴趣的意义上讲)是,当t增加时区域Rt是否仍然是定域性的,或者它是否会向相空间散开去。如果这样的区域在时间推进时仍是定域性的,我们对此系统就有了稳定性的量度。在相空间中相互靠近的点(这样它们对应于相互类似的系统的细致的物理态)将继续靠得很近,给定的态的不准确性不随时间而放大。任何不正常的弥散都会导致系统行为的等效的非预测性。
      我们对于哈密顿系统可以一般地说什么呢?相空间的区域究竟是否随时间散开呢?似乎对于一个如此广泛的问题,很少有什么可说的。然而,人们发现了一个非常漂亮的定理,它要归功于杰出的法国数学家约瑟夫·刘维尔(1809--1882)。该定律讲,相空间中的任何区域的体积在任何哈密顿演化下必须保持常数。(当然,由于我们的相空间是高维的,所以“体积”必须是在相应高维意义上来说的。)这样,每一个R1的体积必须和原先的R0的体积一样。初看起来,这给了我们的稳定性问题以肯定的答案。在相空间体积的这层意义上,我们区域的尺度不能变大,好像我们的区域在相空间中不会散开似的。
      然而,这是使人误解的。我们在深思熟虑之后就会感到,很可能情况刚好与此相反!在图5.14中我想表示人们一般预料到的那种行为。我们可以将初始区域R0想象成一个小的、“合理的”,亦即较圆的而不是细长的形状。这表明属于R0的态在某种方面不必赋予不合情理的精确性。然而,随着时间的发展,区域R1开始变形并拉长--初看起来有点像变形虫,然后伸长到相空间中很远的地方,并以非常复杂的方式纠缠得乱七八糟。体积的确是保持不变,但这个同样小的体积会变得非常细,再发散到相空间的巨大区域中去。这和将一小滴墨水放到一大盆水中的情形有点类似。虽然墨水物质的实际体积不变,它最终被稀释到整个容器的容积中去。区域Rt在相空间中的行为与此很类似。它可能不在全部相空间中散开(那是称之为“爱哥狄克”的极端情况),但很可能散开到比原先大得极多的区域去。(可参阅戴维斯(1974)的进一步讨论。)
      麻烦在于保持体积并不意味就保持形状:小区域会被变形,这种变形在大距离下被放大。由于在高维时存在区域可以散开去的多得多的“方向”,所以这问题比在低维下严重得多。事实上,刘维尔定理远非“帮助”我们将区域Rt控制住,而是向我们提出了一个基本问题!若无刘维尔定理,我们可以摹想相空间中区域的毫无疑义的发散趋势可由整个空间的缩小而补偿。然而,这一个定律告诉我们这是不可能的,而我们必须面对这个惊人的含义--这个所有正常类型的经典动力学(哈密顿)系统的普适的特征9
      鉴于这种发散到整个相空间去的行为,我们会问,经典力学怎么可能作出预言?这的确是一个好问题。这种弥散所告诉我们的是,不管我们多么精确地(在某一合理的极限内)知道系统的初始态,其不确定性将随着时间而不断增大,而我们原始的信息几乎会变得毫无用处。在这个意义上讲,经典力学基本上是不可预言的。(回想前面考虑过的“混沌”概念)
     
     
      那么,何以迄止为止牛顿动力学显得如此之成功呢?在天体力学中(亦即在引力作用下的天体)其原因在于,第一,有关的凝聚的物体数目相对很少(太阳、行星和月亮),这些物体的质量相差悬殊��这样在估量近似值时,可以不必管质量更小物体的微扰效应,而处理更大的物体时,仅仅需要考虑它们相互作用的影响--第二,可以看到,适用于构成这些物体的个别粒子的动力学定律,也可以在这些物体本身上的水平上适用--这使得在非常好的近似下,太阳、行星和月亮实际上可以当作粒子来处理,我们不必去为构成天体的单独粒子的运动的微小细节去担忧10。我们再次只要考虑“很少”的物体,其在相空间中的弥散不重要。
      除了天体力学和投掷物行为(它其实是天体力学的一个特例)之外,只牵涉到小数目的粒子的简单系统的研究,牛顿力学所用的主要方法是根本不管这些细节的“可决定性地预言的”方面。相反地,人们利用一般的牛顿理论做模型,从这些模型可以推导出整体行为。某些诸如能量、动量和角动量守恒定律的准确推论的确在任何尺度下都有效。此外,存在可与制约单独粒子的动力学规律相结合的统计性质,它能对有关的行为作总体预言。(参阅第七章关于热力学的讨论;我们刚讨论过的相空间弥散效应和热力学第二定律有紧密的关系。我们只要相当仔细,便可利用这些观念作预言。)牛顿本人所做的空气声速的计算(1个世纪后拉普拉斯进行了微小的修正)便是一个好例子。然而,牛顿(或更笼统来说,哈密顿)动力学中固有的决定性在实际上适用的机会非常稀少。
      相空间弥散效应还有一个惊人的含义。它告诉我们,经典力学不能真正地描述我们的世界!我说得有点过分了一些,但是并不太过份。经典力学可以很好地适用于流体--特别是气体的行为,在很大的程度上适用于液体--此处人们只关心粒子系统的“平均”性质,但是在对固体作计算时就出了毛病,这里要求知道更细节的组织结构。固体由亿万颗点状的粒子所组成,由于相空间弥散其排列的有序性应不断地降低,何以保持其形状大致不变呢?正如我们已经知道的,量子力学在理解固体的实在结构时是不可或缺的。量子效应可多多少少防止相空间的弥散(见第八章和第九章)。   这也和制造“计算机器”的问题相关。相空间弥散是某种必须控制的东西。相空间中对应于一个电脑的“分立”态的区域(例如前述的R0)不应允许其过度弥散开来。我们记得,甚至弗列得钦--托弗里“撞球电脑”需要某种外围的固体墙才能工作。包括许多粒子的物体的“刚性”正是需要量子力学起作用的某种东西。看来,甚至“经典”电脑也必须借助于量子物理学的效应才能有效地工作!
     
    马克斯韦电磁理论
     
      在牛顿的世界图像中,人们设想一个微小粒子靠一种超距作用的力作用到另一个粒子上。如果粒子不是完全点状的。可以认为由于偶尔的实际物理接触而互相反弹离开。正如我前面(193页)提到的,电学和磁学(古人即知道此两者的存在,威廉·吉尔伯特在1600年和本查明·佛兰克林在1752年分别进行了一些细节的研究)的行为和引力很类似。虽然同号的电荷(磁极强度)相互排斥而不是吸引,它们都以距离的反平方律衰减。这里的电磁力是由电荷(磁极强度),而不是由质量决定其强度。在这个水平上,将电学和磁学归并到牛顿理论中去并没有什么困难。光的行为也可以粗略地(虽然有某些困难)容纳进去。我们或者将光当作单独粒子(正如我们现在应称之为“光子”的那样)组成,或者把它当作某种媒质中的波的运动。在后一情况该媒质(“以太”)本身应认为是由粒子组成的。
      运动电荷会产生磁力的这一事实引起了额外的复杂性,但是这并没有把整个体系瓦解。大量的数学家和物理学家(包括高斯)提出了在一般牛顿框架中似乎满意的、描述运动电荷效应的方程组。第一位向这个“牛顿式”的图像提出严肃挑战的科学家是英国伟大的实验家兼理论家米凯尔·法拉第(1791--1867)
      为了理解这个挑战的性质,我们首先要定义物理的概念。首先考虑磁场。大部分读者都有过这样的经验,将一张纸放在磁铁上时,纸上的铁粉末具有特别的形态。这些粉末以一种令人惊异的方式沿着所谓的“磁力线”串起来。我们可以想象,即便粉末不在该处,磁力线仍在那里。它们构成了我们称之为磁场的东西。这“场”在空间的每一点都朝着一定的方向,亦即在该点力线的方向。实际上,我们在每一点都有一个矢量。这样,磁场就给我们提供了一个矢量场的例子。(我们可把它和上一节考虑的哈密顿矢量场相比较,但现在这一个矢量场是在通常的空间中,而不在相空间中。)类似地,一个带电的物体被一种称之为电场的不同种类的场所围绕;而且引力场也类似地围绕着任何有质量的物体。这些也都是空间的矢量场。
      远在法拉第之前,人们就有了这些观念,它们已成为牛顿力学理论家的一部份武器。但是认为这种“场”中不包含实际物理物质的观点占优势。反之,它们被当作为某一个粒子放在不同的点时所作用的力提供一种必要的“薄记”。然而,法拉第深刻的实验发现(利用运动线圈、磁铁等等)使他坚信,电磁场真正的“东西”,并且变化的电磁场有时会相互“排挤”到原先空虚的空间,以产生一种脱离物体的波动!他猜测到光也许就包括这类波动。这种观点背离了占统治地位的“牛顿智慧”。按照牛顿的观点,这类场不能在任何意义上被认为是“真实的”,而仅仅是作为“真正的”牛顿点粒子超距作用“实在”图像的方便的数学辅助物而已。
      面临着法拉第以及优秀的法国物理学家安德列·玛雷·安培(1775--1836)和其他人更早的实验发现,伟大的苏格兰物理学家兼数学家詹姆斯·克拉克·马克斯韦(1831--1879)对从这些发现产生的电磁场方程的数学形式感到疑惑。他以惊人的灵感,对这些方程作了初看起来似乎非常微小的,但却是含义深远的改变。这个改变根本不是由已知的实验事实(虽然与之相协调)暗示的。这是马克斯韦理论自身所要求的结果,部分是物理学上的,部分是数学上的,还有部分是美学上的。马克斯韦方程的一个含义是电磁场的确在空虚的空间中相互“推挤”。振动的磁场产生振动的电场(这是法拉第的实验发现所隐含的)。而振动的电场又反过来产生振动的磁场(由马克斯韦理论推导得来的),并且这又接着产生电场等等。(这种波的详图见312页的图6.26313页的图6.27。)马克斯韦能够算出这种效应在空间传播的速率--并且他发现这正是光的速率!此外,这些所谓的电磁波还展示出了很久以来就知道的于涉和令人困惑的极化性质(我们在第六章269311页还要回到这些上来)。除了说明波长在一个特定范围(4�7×107米)的可见光的性质外,还预言了导线中电流产生的其他波长的电磁波。出色的德国物理学家亨利希·赫兹1888年在实验上证实了这种波的存在。法拉第的富有灵感的希望在美妙的马克斯韦方程中的确找到了坚实的基础!
      虽然我们在这儿并不必了解马克斯韦方程的细节,稍微看看它们是什么样子的并没有什么害处:   此处EBj分别为电尝磁场和电流;ρ为电荷密度,c只是一个常数,也就是光速11。不必忧虑curldiv等项,它们简单地表示不同类型的空间变化。(它们是某种相对于空间座标的偏微分算符的组合。可以回想我们在讨论哈密顿方程时遇到的用符号表示的偏微分运算。)在前面两个方程左边出现的算符/t实际上和用在哈密顿方程的点一样,其不同之处只是技术性的。这样E/t表示电场的变化率,而B/t表示磁场的变化率。第一个方程说明电场如何按照磁场和电流在该时刻的行为而变化;而第二个方程说明磁场如何按照电场在该时刻的行为而变化。第三个方程粗略地讲是反平方律的另一种形式,它是讲(该时刻的)电场必须和电荷分布相关;而第四个方程对磁场说同样的东西,除了在这情况下没有“磁荷”(或分开的“北极”或“南极”粒子)以外。
      这些方程在下面这一点和哈密顿的很相像,即依据在任何给定时刻的电场和磁场的值,它们给出了这些量对时间的变化率。所以马克斯韦方程和通常的哈密顿理论一样是决定论的。仅有的也是一个重要的差别是,马克斯韦方程是方程而不是粒子方程。这表明我们需要用无限个参数去描述系统的态(空间中的每一点的场矢量),而不仅仅需要像在粒子论中的有限的数目参数(每个粒子的三个位置和三个动量座标)。因此马克斯韦理论的相空间是无限维的!(正如我以前提到过的,一般的哈密顿框架,实际上可以包容马克斯韦方程。但由于这无限的维数,该框架必须稍微推广一下12。)
      马克斯韦理论为我们的物理实在的图像添加上具有根本性的新的部分。我们必须接受自身的存在,而不能把它仅仅当作牛顿物理中的“实在”粒子的数学的附属物。在这一点上它超越了我们的原先的理论框架。马克斯韦的确向我们指出,当场以电磁波传播时,它们自身携带一定量的能量。他还给出了这种能量的显明的表达式。从一处传播到另一处的“脱离物体”的电磁波能传递能量的这一惊人事实,最终由赫芝在实验上探测到它的存在而被证实。这个事实虽然如此惊人,而现在却变成这么熟悉的东西了。
     
    可计算性和波动方程
     
      马克斯韦能直接从他的方程推导出,在没有电荷或电流(亦即在上述方程中j=0,ρ=0)的空间区域,所有电磁场的分量必须满足一称为波动方程的方程。由于波动方程是有关于一个单独的量的,而不是电磁场的所有六个分量的方程,所以可视作马克斯韦方程的“简写”。它的解表现了类似波动的行为,并牵涉到诸如马克斯韦理论的“极化”(电场矢量的方向,见311页)等等其他复杂性。
      因为波动方程及其可计算性的关系已被清楚地研究过,所以我们对它格外有兴趣。事实上,玛利安·玻依堪·玻--埃勒和因·里查德(197919811982,还可参阅1985)指出,尽管波动方程在平常的意义上具有决定性的行为,--亦即初态数据一被提供,则其他时刻的解即被决定--还存在某种古怪类型的可计算的初始数据,它使得在以后可计算的时刻被决定的场的值实际上是不可计算的。这样,此一似是而非的物理场论的方程(虽然不完全是在我们世界中实际成立的马克斯韦方程)会在玻--埃勒和里查德的意义上产生不可计算的演化!
      这结果在表面上似乎相当令人震惊--这看来和我在上一节的猜测相抵触,除了那时人们关心的是“合理的”哈密顿系统的可能的可计算性以外。然而,玻--埃勒和里查德结果固然是惊人的并和数学有关系,它和猜测的冲突并没有什么真正的物理意义。原因在于,他们“古怪”的初始数据不以一种通常人们对物理上有意义的场所要求的方式而“光滑地改变”13玻--埃勒和里查德实际上证明了,如果我们不容许这一类场,则不会产生不可计算性。无论如何,甚至如果允许这类场,很难想象任何物理“仪器”(诸如人脑?)能利用这样的“不可计算性”。这只有当允许作任意高精度的测量时才相干。但正如我说过的,这在物理上不是非常现实的,尽管如此,玻�埃勒和里查德的结果代表了一个重要研究领域的美妙开端,迄今这个领域还很少被研究过。
     
    洛伦兹运动方程;逃逸粒子
     
      马克斯韦方程本身还不是一个完整的方程组。如果给定了电荷和电流的分布,则它们提供了电磁场传播方式的美妙的描述。在物理上,这些电荷主要是我们知道的电子和质子等带电粒子,而电流是由这种粒子的运动所引起的。如果我们知道这些粒子在何处并如何运动,则马克斯韦方程告诉我们电磁场会如何行为。该方程并没有告诉我们这些粒子自身如何行为,此问题的部分答案在马克斯韦年代即已经知道,但直到1895年杰出的荷兰物理学家亨德里克·安东·洛伦兹利用与狭义相对论有关的思想去推导现在称之为带电粒子的洛伦兹运动方程后(参阅威塔克(1910)310页,395页),才得到了令人满意的方程组。这些方程告诉我们带电粒子的速度如何因所处的电磁场的影响而连续地改变14。把洛伦兹方程和马克斯韦方程相联立,人们便能同时得到带电粒子的电磁场的时间演化的规则。
      然而,这一套方程并非一切都相安无事。如果一直到粒子的自身的直径的尺度之下(电子的“经典半径”大约为10-15米)场都是非常均匀的,而且粒子运动也不过分激烈的话,则它们给出了极好的结果。但此处存在一个原则上的困难,在其他情况下它会变得重要起来。洛伦兹方程要我们去做的是考察带电粒子所在处的准确的那一点的电磁场(并且实际上提供了该点的“力”)。如果粒子是有限尺度的,则那一点应如何选取呢?是否我们应取粒子的“中心”,或是对表面上所有点的场(“力”)取平均?如果场在粒子尺度下不是均匀的,则这就产生了差异。还有更严重的问题:粒子表面(或中心)的场究竟如何?记住我们考虑的是一个带电的粒子。粒子本身引起的电磁场必须叠加到粒子所处的地方的“背景场”上去。粒子的自身场在靠近“表面”处变得极强,并且轻而易举地糟塌它附近的所有其他的场。而且,围绕着自身的粒子场会多多少少地指向外面(或内面)。这样粒子所要反应的总的实际场根本不是均匀的,在粒子“表面”的不同地方指向不同的方向,更不要说它的“内部”了(图5.15)。现在我们必须开始忧虑,互异的作用到粒子上的力是否使之旋转或变形,我们必须知道它的弹性性质等等(并且这里还有一个和相对论有关的特别有疑问的问题,我先不在此烦恼读者)。显然,这个问题比初看时复杂得多。
     
     
      也许我从一开始就把粒子当作粒子会更好些。但这会导致另一类问题,因为在粒子的近邻处其自身的电场会变成无穷大。按照洛伦兹方程,如果它必须对它所处的地方的电磁场响应,则它必须对此无穷大的场响应!为了使洛伦兹力定律有意义,必须找出一种减去粒子自身的场以剩下的有限的背景场的方法,这样粒子才能毫不含糊地对背景场响应。1938年狄拉克(我们在后面还要提到他)解决了这个问题。但是,狄拉克解导出了某些令人恐慌的结论。他发现为了决定粒子和场的行为,不但必须知道每个粒子的初始位置和速度,也必须知道其初始加速度(这是一种在标准的动力学理论的范围内不太正常的情况)。对大多数的初始加速度值,粒子的最终行为变得完全疯狂,它自发地加速并很快地趋近于光速!这就是狄拉克的“逃逸解”,它并不对应于任何实际发生在自然里的东西。人们必须找到一种正确选择初始加速度以避免逃逸解的方法。只有一个人使用“先知”--也就是,必须指明能最终导出逃逸解的初始加速度并避免之,才能做到。这根本就不是在一个标准的决定性的物理问题中选择初始条件的方法。在传统的决定论中,这些初始数据可以任意给定,不受任何未来的行为要求的约束。而在这里,不仅是将来完全决定了在过去某一时刻的应选取的初始值,而且这些非常特别的数据由于要使未来行为确实“合理”的要求,而被非常苛刻地约束。
      基本的经典方程就只能走到这么远。读者会意识到经典物理定律中决定性和可计算性的问题真是乱麻一团,在物理学定律中是否有一个目的论的因素呢?未来是否对过去允许发生的事有某种影响呢?在实际上,物理学家并未认真地将这些经典电动力学(经典带电粒子和电磁场的理论)的含义当作实在的描述。他们对上述困难通常回答是,带电的单独粒子问题是在量子电动力学范畴里,我们不能指望利用纯粹经典过程得到有意义的答案。这无疑是对的。但正如我们以后将要看到的,在这一点上量子理论自身也有问题。事实是,狄拉克正是因为想到,也许能为解决(物理上更适当的)量子问题中的甚至更大的基本困难得到灵感,而考虑带电粒子的经典问题。以后我们必须面临量子理论的这个问题!
    爱因斯坦和彭加莱狭义相对论
     
      我们回顾一下伽利略的相对性原理。它告诉我们,如果我们从一个静止座标系转换到运动座标系,伽利略和牛顿的物理定律完全不变。这意味着仅仅考察在我们周围的物体的动力学行为,不能确定我们是处于静止状态,还是沿着某一方向作匀速运动。(回忆一下187页描述伽利略在海上的船)。当我们将马克斯韦方程合并到这些定律中去时,伽利略的相对论仍然对吗?我们知道马克斯韦电磁波以固定的速率--即光速传播。常识似乎告诉我们,如果我们在某一方向非常快地运动,则光在那一方向相对我们的速率应减少到比c小(因为我们沿着那个方向去“追逐”光线),而且在相反的方向光速应相应地增加到比c大(因为我们向着光运动)--这都和马克斯韦理论的不变的c不一致。确实,常识似乎是对的:合并的牛顿和马克斯韦方程满足伽利略相对论。
      正是由于对这件事体的忧虑导致爱因斯坦于1905年--事实上彭加莱在他之前(1898--1905)--提出狭义相对论。彭加莱和爱因斯坦各自独立地发现马克斯韦方程满足一个相对论原理(参阅派斯1982);也就是如果我们从一个静止座标系换到运动座标系时,方程也有类似的不变的性质。虽然在这种情况下,变换规则和伽利略--牛顿物理不相容!为了使两者相容,必须修正其中的一组方程--或者抛弃相对论原理。
      爱因斯坦不想抛弃相对论原理。他凭着超等的物理直觉坚持,这个原则必须对于我们世界的物理定律成立。此外,他知道伽利略--;牛顿物理对于所有的已知现象,只在速度和光速相比很微小的情况下被检验,这时不相容性不显著。只有光本身才牵涉到速度大到足以使这种偏离变重要。所以,正是光的行为才能告诉我们究竟要采用何种相对论原理--而制约光的方程正是马克斯韦方程。这样适合于马克斯韦理论的相对论原理要保留;而相应地伽利略--牛顿定律要作修正!   在彭加莱和爱因斯坦之前,洛伦兹也着手并回答了问题。直到1895年,洛伦兹采取的观点认为将物质结合在一起的力量具有电磁性(后来证明正是如此)。这样,实在物体的行为应该满足从马克斯韦方程推导出的定律。其中一个推论,是以与光速可相比拟的速度运动的物体在运动的方向会有微小的收缩(所谓的“费兹杰拉德--洛伦兹收缩”)。洛伦兹利用它来解释迈克尔逊和莫雷在1887年进行的令人困惑的实验发现。该实验似乎指出不能用电磁现象来确定一个“绝对”静止的坐标系。(迈克尔逊和莫雷指出,地球表面上的光的表观速度不受地球绕太阳公转的影响,这和预想的非常不一样。)是否物体的行为总是这样,以至于不可能在局部检验它的匀速运动呢?这是洛伦兹的近似的结论;而且他只局限于物体的特殊的,也就是认为只有电磁力才有意义的理论。作为一位杰出的数学家,彭加莱在1905年指出,马克斯韦方程基础的相对论原理,物体有一个精确的行为方式使得局部检测物体的匀速运动根本办不到。他并透彻地了解了此原理的物理含义(包括我们很快就要考虑到的“同时性的相对性”)。他认为这仅仅是一种可能性,而不像爱因斯坦那样坚持相对论原理必须成立。
      马克斯韦方程满足的相对性原理后来被称作狭义相对论。要掌握它不甚容易。它有许多反直观的特征,一下子很难把这些特征当作我们生活其中的世界的性质接受下来。事实上,若不是富有创见和洞察力的俄国/德国几何学家赫曼·闵可夫斯基(1864--1909)1908年引进了进一步的要素,很难对狭义相对论赋予意义。闵可夫斯基曾是爱因斯坦在苏黎士高等理工学院的导师。1908年,闵可夫斯基在他发表在哥廷根大学的著名演讲中说道:
      从今以后空间自身以及时间自身必像影子般地渐渐消退,只有两者的某种结合保持为独立的实体。  现在,让我们按照美妙的闵可夫斯基空间--时间来理解狭义相对论的基础。
      和空间--时间概念相关的一个困难在于它是四维的,这样要去摹想它就非常困难。然而,我们已逃过了相空间这一关,区区四维不会引起我们太多的麻烦!和以前一样,我们将采用“欺骗”的手法把空间画成更少的维数--但是,这回欺骗的程度没有过去那么严重,我们的图画也相应地更为准确一些。二维图(一维空间和一维时间)对许多目的是足够的。但我还希望读者允许我有点更冒险地升高到三维图(二维空间和一维时间)。这样子我们就得到了非常好的图画,并在原则上认为不必做许多改变就可将三维图的观念推广到四维的情况去。关于空间--时间里要记住的是,在它上面的每一点代表一个事件--也就是某一时刻的空间的一点,只有瞬息存在的一点。整个图代表过去、现在和将来的全部历史。因为一个粒子总存留在时间内,所以它不是以一点,而是以称作粒子的世界线的一条线来代表。如果粒子做直线匀速运动,则其世界线为直线。如果它作加速运动(亦即匀速运动),则世界线是弯曲的。世界线描述了粒子存在的整个历史。
      我在图5.16中画出了具有二维空间和一维时间的空间--时间图。我们可想象沿着垂直方向测量有一标准的时间座标t,以及在水平方向测量的两个空间座标x/cz/c,在中心处的圆锥是空间--时间原点O的(未来)光锥。为了领略其意义,可以想象在事件O处发生一次爆炸。(此爆炸在时刻t=0发生在空间的原点。)从爆炸发出的光的历史正是此光锥。在二维空间中看,闪光是以基本的光速c向外运动的圆圈。在全部三维空间中看,变成以光速c向外运动的一个球面--光的波前的球面--但是我们在这儿压缩了空间方向,所以只得到了一个圆圈,正如从一块石头落到水池中去的那一点发出的涟漪的圆圈那样。如果我们在向上的方向连续截割光锥的话,就能在此空间--时间中看到这一圆圈。这些水平面代表随时间坐标t增加时不同的空间的描述。相对论的一个特征是,一个物质粒子不能以比光速更快的速度运动(后面还要讲到)。所以从爆炸出来的物质粒子必须落到闪光的后头。用空间--时间的语言来说,这表明所有这些粒子的世界线必须在光锥内部
     
      用称作光子的粒子比用电磁波来描述光更为方便。此刻我们暂时可以将一个“光子”当作一个电磁场高频振动的小“波包”。在下一章我们将要讨论的量子描述中,这个术语的物理意义将会更清楚。但在这里“经典”光子对我们也是有助的。在自由空间中光子总是以基本速度c沿直线运动。这表明在闵可夫斯基空间--时间图中光子的世界线总是画成一根和垂直线倾斜45°的直线。在O点处的爆炸产生的光子描写了一个中心位于O的光锥。这些性质在空间--时间的所有点都应成立。原点并没有任何特别之处;点O和任何其他点无区别。这样的空间--时间的每一点都必须有一个和在原点光锥具有同样意义的光锥。如果我们宁愿使用光的粒子描述的话,则任何光束的历史亦即光子的世界线,在每一点上总沿着光锥,而任何物质粒子的历史必须在每一点的光锥的内部。这一切从图5.17可以看到。所有点处的光锥族可以被看成空间--时间的闵可夫斯基几何的一部分。
     
      图5.18(a)欧几里德几何和(b)闵可夫斯基几何的“距离”测量的相互比较(后者的“距离”表示经历的“时间”)。
      什么是闵可夫斯基几何?光锥结构是其最重要的方面。但是闵可夫斯基几何有比这更丰富的内容。它有一种和欧几里德几何的距离极相似的“距离”的概念。在三维欧几里德几何中,按照标准的笛卡尔座标,从点到某一点距离r可写作
      r2=x2+y2+z2
     
     
      (见图5.18a。这正是华达哥拉斯定理--或许二维的情况更熟悉些。)在我们的三维闵可夫斯基几何中,其表达式非常相似图5.18b),根本的差别是我们有两个负号
      s2=t2-(x/c)2-(z/c)2
      更正确地讲,我们应该有维闵可夫斯基几何,当然距离表达式应写作
      s2=t2-(x/c)2-(y/c)2-(z-c)2
      此表达式中“距离”s的物理意义是什么呢?假定有一点其座标为{tx/cy/cz/c}。(或者在三维的情形{tx/cz/c};见图5.16),并且在O的(未来)光锥的内部。则直线段OP可以代表某一个物质粒子--比如说由我们爆炸发射出的某一个特定粒子的一部分历史。线段OP的闵可夫斯基“长度”s有直接的物理解释,它是粒子所实际经验的事件OP之间的时间间隔!这就是说,如果有一非常可靠和精确的钟附在该粒子上15,那么在事件OP记录下的时间的差刚好是s。和通常预料的相反的是,座标值t本身描述精确的钟测量的时刻,除非它“静止”地处于我们的座标系中(亦即x/cy/cz/c取固定值),这表明在图中钟有一根“垂直”的世界线。这样,只对于“静止”(亦即具有“垂直”世界线)的观察者“t”才表示“时间”。按照狭义相对论,量s为每一位从原点以均匀速度离开的观察者提供正确的时间量度。这是非常令人吃惊的--和伽利略--牛顿的简单取座标值t为时间测量的“常识”十分矛盾。我们注意到,只要有任何运动,则相对论性(闵可夫斯基)的时间测量s总是比t要小(因为从上式我们知道,只要x/cy/cz/c不全为零,则s2t2小。)运动(亦即OP不沿着--轴)总是使得在和座标值t相比较钟“变慢”。如果运动速度和c比较很小,则st就几乎一样,这就解释了为何我们不知道“运动着的钟走得慢”的事实。在另一种极端情况下,速度刚好为光速,P就处在光锥上,我们发现s=0。光锥刚好是它从0起,闵可夫斯基“距离”(亦即“时间”)为零的集合。这样,光子根本没有“经历”任何时间流逝!(我们不允许极端的情况,P运动到光锥外面,因为这一来s变成虚的了--也即负数的平方根--也就是违反了物质粒子或光子不能运动得比光快的规律。
      可以把闵可夫斯基“距离”一样好地应用于空间--时间中的任何一对点上去,其中一点处在另一点的光锥之内--这样,一个粒子可以从一点运动到另一点。我们简单地考虑将O移到空间--时间中的某一不同点。两点间的闵可夫斯基距离是一台从一点匀速运动到另一点的钟经验的时间的间隔。当此粒子允许为光子时,闵可夫斯基距离变成零,我们两点中的一点就必须处在另一点的光锥上--这个事实可用来定义那一点的光锥。
      闵可夫斯基几何的基本结构以及世界线的“长度”的古怪测度包含了狭义相对论的精华。在这里,世界线的“长度”被解释作物理钟所“测量”(或“经历”的时间。特别是读者也许熟悉的相对论中的“双生子佯谬”:双生子中的一个留在地球上,而另一个以接近于光速的巨大速度旅行到邻近恒星上去,然后再返回。当他返回之时,人们发现两人衰老得不一样。旅行者还很年轻,而他那位待在家里的兄弟却已垂垂老矣。这按照闵可夫斯基几何很容易描述--人们可以看到,这个现象虽然令人迷惑,实际上并非荒谬。我们在图5.19中用世界线,AC代表留在家中的那个双生子,而旅行者的世界线包括ABBC两段,这代表去和回的航行的两个阶段。留在家中的那个双生子所经历的时间由闵可夫斯基距离AC所测量,而旅行者所经历的时间由两段闵可夫斯基距离ABBC的总和16给出。这两个时间不同,而且我们有
      ACAB+BC
      此不等式的确表明留在家中的那个所经历的时间比旅行者更长。 
      上面的不等式看起来和通常的欧几里德几何中的著名的三角形不等式ABC,现在变成了欧几里德空间中的三点),亦即
      ACAB+BC
      相当类似。该不等式断言,一个三角形的两边的和总比第三边。我们并不把这个当成佯谬!从一点到另一点(这里是从AC)之间的距离依赖于我们采取的实际途经,这是起码的常识。(在现在情形下,这两种途径为AC以及更长的折线ABC)。它是两点(此处为AC)之间的最短距离为连接它们的直线(直线AC)度量的特例。不等式符号在闵可夫斯基情况下的反向是因为定义“距离”时的符号改变所引起,因此闵可夫斯基的AC比折线ABC更长”。闵可夫斯基“三角形不等式”是更一般结果的特例:连接两个事件的最长的(在经历最长时间的含义上)世界线为直线(亦即加速度为零)。如果两个双生子从同一事件A开始并终结于同一事件C。第一个双生子没有加速地从A旅行到C,而第二个加速,则他重新相遇时,前者总是经历了更长的时间流逝。
      以与我们直觉相矛盾的方式,引进这样的时间测度的奇怪概念,似乎是有点荒谬。但是现在已有极大量的实验证据支持它。例如,许多次原子粒子以一定的时间尺度衰变(亦即分裂成其他粒子)。这些粒子有时以非常接近光速的速度运动(譬如从外空间到达地球的宇宙线或是人造的粒子加速器中的粒子),它们衰变时间精确地以从上述考虑导出的方式变迟缓。以下事实会更令人印象深刻,现代的钟(“核子钟”)可以做得如此精密,以至于时间变化效应可被快速低空飞行的飞机携带的钟直接检测出来,结果和闵可夫斯基“距离”测度s,而不和t相一致。严格地讲,考虑到飞机的高度,就牵涉到广义相对论的一个小的附加的引力效应,但是这些也都和观测相一致;参阅下一节。)此外,还有许多其他紧密地和整个狭义相对论框架相关的效应,它们都经常接受了严密的验证。爱因斯坦的著名的关系
      E=mc2
      即是其中之一,这表明能量和质量等效。在本章的结尾我们要遇到这一个关系式的一个令人哭笑不得的推论!   我还没有解释相对论原理如何和这类事体相协调。以闵可夫斯基几何的观点看,以不同的均匀速度运动的观察者怎么会是等同的?图5.16中的时间轴(“静止观察者”)怎么能和其他直的世界线,比如OP(“运动观察者”)完全等同?让我们先考虑欧几里德几何,很清楚,就几何整体而言,任何两条直线都是完全等同的。人们可以将整个欧几里德空间在自身上,“刚性”地滑动,使得其中一条直线和另一条直线的位置重合为止。考虑一个二维亦即欧几里德平面的情形。我们可以想象在一个平面上刚性地移动一张纸,使得画在纸上的任一条直线和平面上的已给定的直线相重合。这个刚性运动保持几何结构不变。虽然稍不明显一些,这些议论类似地在闵可夫斯几何中也成立。在这里人们必须小心地理解“刚性”的含义。现在我们用一种古怪的材料取代那张滑动的纸��为了简单起见,我们首先研究二维的情况--该材料在一个45°方向上伸长而在另一个45°方向上压缩时两条45°线必须仍保持为45°线。从图5.20可看到这一点。在图5.21中我试图描绘三维的情形。这种称作彭加莱运动(或非齐次洛伦兹运动)的闵可夫斯基空间的“刚性运动”似乎显得不“刚性”,但它保持了所有的闵可夫斯基的距离。而“保持所有距离”在欧几里德情况下正是“刚性”的意义。狭义相对论原理声称,物理在这种空间��时间的彭加莱运动之下不变。尤其是,世界线为我们原先闵可夫斯基图画(图5.16)的时间轴的“静止”的观察者S和以OP为世界线的“运动”观察者M有完全一样的物理。
     
     
      
      每一座标平面t等于常数代表观察S的任一“时刻”的空间,亦即他认为同时(发生在“同一时刻”)的一族事件。我们称此平面为S同时空间。当我们过渡到另一观察者M,就必须将原先的同时面族抛弃,而取代以M的同时面族17。我们注意到图5.21中的M的同时面显得向上倾斜。按照欧几里德几何的刚性运动思考,则会以为这倾斜似乎方向错了,但在闵可夫斯基情况下正是我们所预料的。当S认为所有在t为常数的平面上的事件同时发生时,M却持不同观点:从他看来,在他的每一个倾斜的等时空间上的事件才显得是同时的!1可夫斯基几何本身并不包含“同时性”的唯一概念,而每一位匀速运动的观察者各有自己的“同时性”的概念。
     
     
      考虑图5.21中的两个事件RQ。依S看来,事件R在事件Q之前发生,因为R处于比Q更早的同时面上;但是,依M看来,情况刚好相反,Q处于比R更早的同时面上。这样,一个观察者认为事件R早于Q发生,而另一个观察者认为QR早发生!(只有当RQ所谓类空地分隔开也就是一个事件处在另一事件的光锥之外,并因此没有物质粒子或光子能从一个事件运动到另一个事件时,这才会发生。)只要事件在相隔非常远的距离上发生,甚至非常小的相对速度也会导致重大的时序差异。假定在仙女座大星云(离开我们银河系最近的大星系,大约是二千亿亿公里那么远)处发生了一个事件,地球上两个观察者相互遭遇时将他们的钟对好,由于他们的运动速度不同,他们两对该事件发生时刻的判断可有几天的差别(图5.22)。对于其中一个人来说,试图去歼灭地球行星上生命的空间飞船队已上路了;而对于另外一个人来说,尚未决定是否要发射这个飞船队。
     
    爱因斯坦广义相对论
     
      我们回忆一下伽利略关于任何物体在引力场中同样快下落的伟大的洞察。(这是洞察的而不完全是直接观察的结果。由于空气阻力作用,羽毛和石头不会一起下落!伽利略的洞察在于意识到,如果空气阻力可减少到零,它们就会一起下落。)这一直觉的深刻意义整整花了三个世纪的时间才被意识到,而成为一个伟大理论的奠基石。这就是爱因斯坦的广义相对论--引力的一个非同寻常的描述。正如我们很快就要理解到的,为了实现它,我们需要引进弯曲的空间--时间的概念。
      伽利略的洞察和“空间--时间曲率”有何关系呢?我们知道在牛顿的理论中粒子被通常的引力所加速。这样的一个与之如此不同的思想,怎么能重新产生并且改善那个理论的所有超等的精确性呢?此外,伽利略古老的直觉包含着以后被合并到牛顿理论中的某种东西,这怎么可能呢?
      由于最后一个问题最易于回答,让我们从它开始。在牛顿理论中,是什么制约着在引力作用下的物体的加速度?首先,引力作用到物体上,牛顿引力定律告诉我们这必须和物体质量成正比。伽利略的直觉是发生在牛顿引力定律中的“质量”和牛顿定律中的是同一“质量”。(可以用“比例于”来取代“同一的”。)正是它保证了引力作用下的物体的加速度实际上与它的质量无关。在牛顿的一般理论中完全没有要求这两种质量概念的同一性。牛顿只是把它当成一个假设。的确,在反平方律方面电力和引力是类似的,但电力所依赖的是与牛顿第二定律中的质量完全不同的电荷。“伽利略直觉”不能应用于电力:在电场中物体(带电的物体)不会以同样的速度下落!
      现在,我们就简单地接受伽利略关于引力作用下的运动的洞察,并探究其含义。设想伽利略从比萨斜塔上释放两块石头。如果在一块石头上有一镜头指向另一块石头的摄像机,那么其提供的摄像是一块在空中徘徊的石头,就像引力对它没有影响似的(图5.23)!这正是因为在重力下所有物体都以同样速度下落。
     
     
      我们在这里不管空气阻力。因为在太空中实际上没有空气,所以太空飞行给我们提供了这些观念的一个更好的验证。现在,太空中“下落”简单地表示在引力作用下沿着合适的轨道运动。这个“下落”没有必要是冲着地球中心的直线下降。运动也可以有水平分量。如果此一水平分量足够大,那它就能围绕地球而不必朝向地面的方向“下落”!在引力下的自由轨道上旅行只不过是一种优雅(并且非常昂贵)的“下落”方式。正如前面使用摄像机,现在一位作“太空行走”的航天员看到他的空间飞船在他之前徘徊,表观上不受在他之前的地球的巨大的球体的引力的影响(见图5.24)!这样,人们只要过渡到自由下落的“加速参考系”去,就可以局部地消除引力效应。
     
     
    因为引力场效应正和加速度效应一样,所以可用自由下落的方式来对消引力。事实上,你如果处在一台正在加速上升的电梯之内,就会简单地觉得表观引力场的增大;如果电梯下降,则引力场减弱。如果悬挂电梯的绳索断了,那整个下落加速度就完全抵消了引力的效应(不考虑空气阻力和摩擦效应),而电梯乘客就像上述的航天员那样显得在空中自由浮动,直到它撞到地面上为止!甚至在火车和飞机上,加速度会使一个人感到引力的强度和方向不和他视觉提示的应是“往下”的方向一致。这是因为加速度和引力效应是相类似的,人的感觉不能将它们区分开来。爱因斯坦把引力的局部效应和加速度参考系的效应等效的事实称为等效原理
     
      上述的考虑是“局部的”。然而,如果人们允许去做足够精密的(不完全局部的)测量,他就能在原则上断定在“真正”引力场和纯粹加速度之间的区别。在图5.25中我用稍微夸张的方式显示出由许多粒子构成的原先静止的球面,在地球引力作用下自由下落时如何受(牛顿)引力场的非均匀性的影响。该引力场在两个方面不均匀。首先,因为地球在有限距离的某处,靠近地球表面的粒子向下加速比远处的粒子更快(由于牛顿反平方律引起)。第二,由于同一个原因,在水平方向上不同位置的粒子加速度的方向也有些轻微差别。球面由于这种非均匀性引起了微小变形而成为一个“椭球面”。由于它靠近地球的部分遭受到比远处的部分稍微更大的加速度,它在向地球中心方向(以及相反的方向)被拉长。由于加速度在沿地球中心方向稍微向内侧的作用,它在水平方向变狭窄。
      这种畸变效应被称为引力的潮汐效应。如果我们用月亮来取代地球的中心,并且粒子的球面用地球表面取代,则我们刚好得到由于月亮的影响而在地球表面产生的潮汐,鼓出的部分正是朝着和背着月亮的方向。这个不能用自由下落“消除”的引力场的一般特征正是潮汐效应。(潮汐畸变的大小实际和离开吸引中心的距离成反立方律,而不是反平方律的关系。)
     
      牛顿引力的反平方律可按照这个潮汐效应得到一个简单的解释:由原先18球形而畸变成的椭球的体积等于原先球体(就认为该球面围绕着真空好了)的体积。这种体积性质是反平方律的特征,它对于其他的力的定律不成立。下一步,我们假定球面围绕着的不是真空而是总质量为M的某物体。此物体的引力产生附加的向内去的加速度分量。这样,由原先粒子球面变形成的椭球体积就会收缩,其收缩量和M成比例。我们让球面以固定的高度围绕着地球(图5.26),所发生的体积减小效应即为一个例子。由地球引力导致平常的向下(亦即向内)加速就是引起球形体积减小的同一个原因。这种体积减小效应印证了牛顿引力定律继续存在的部分,也即此力和吸引物体的质量成正比。我们画出这种情形的空间--时间图。我在图5.27上画出球面(在图5.25中画成了一个圆圈)上粒子的世界线。我在这里是用使球面的中心显得处于静止(“自由下落”)的座标系。广义相对论把自由下落运动看作“自由运动”--和无引力物理中的“均匀直线运动”相类似。这样,我们试图在空间--时间中用“直”的世界线来描绘自由下落。然而,从图5.27看出“直”这个字在此处的用法显得混乱。这只不过是术语的问题。我们以后就将自由下落的粒子的世界线称作空间--时间的测地线
     
     
      
      这是一个好术语吗?“测地线”在通常情况下的含义是什么呢?我们考察二维曲面的类似情形。测地线为在曲面上(局部的)“最短程”的曲线。如果我们想象在此曲面上拉伸一根绳子(不要太长,否则它会滑走),那么这根绳子在曲面上就和一根测地线相重合。我在图5.28上给出了两个曲面的例子,第一个具有“正曲率”(和球面类似),而第二个具有“负曲率”(一个马鞍形的面)。在正曲率曲面上,两根互相邻近的一开始相互平行的测地线会相互靠近;对于负曲率曲面,它们会相互离开。如果我们想象,自由下落粒子的世界线在某种意义上像是曲面上的测地线,则可以看到在前面讨论的引力潮汐效应和曲面的曲率效应之间有种紧密的相似性--但是现在情形下正的和负的曲率效应会同时存在。我们可从图5.25和图5.27看到,空间--时间的“测地线”在一个方向上互相离开(当它们和地球在同一直线上时)--正如图5.28中负曲率曲面的情形--在另一方向上它们互相靠近(当它们相对于地球处于水平的方向上)--正如图5.28中正曲率曲面的情形。这样,我们的空间--时间曲率确实似乎具有类似于我们两个曲面的“曲率”,但是由于更高的维数而变得更为复杂,在不同的位移上牵涉到正和负的曲率的混合。
      这就显示了如何用空间--时间“曲率”的概念来描述引力场。这种描述的可能性终究到底是从伽利略的直觉而来的(等效原理),它允许我们用自由下落来消除“引力”。实际上我到此为止还不必要超出牛顿理论的范围。这个新的图像只是为此理论提供了重新表述19。然而,当我们将此图像和狭义相对论的闵可夫斯基描述--亦即现在我们知道应用于不存在引力情况下的空间--时间几何相结合时,就得到了新的物理。其最终的结合物即为爱因斯坦的广义相对论
      回想一下我们从闵可夫斯基得到的教益。引力不存在时,空间--时间中定义了两点之间的特殊类型的“距离”测度。我们在空间--时间中有根描述某粒子的世界线,则沿着此世界线测量的闵可夫斯基“距离”表示这个粒子实际经历的时间。(在前一节我们事实上只考虑沿着与直线段一致的世界线的“距离”,但这个断言对于任意弯曲的世界线“距离”的测量也成立。)如果没有引力场--亦即没有空间--时间曲率时,闵可夫斯基几何是准确的。但是在引力存在时,我们只能将闵可夫斯基几何当作一种近似--如同平面是弯曲曲面几何的近似描述一样。我们如果用放大倍数越来越大的显微镜去考察曲面--使得曲面的几何伸展到越来越大的范围去--则该曲面就显得越来越平坦。我们说一个弯曲曲面在局部上像是一个欧几里德平面20。我们可以以同样的方式说在引力存在时,空间--时间在局部上像闵可夫斯基几何(也就是平坦的空间--时间),但是我们在更大的尺度下允许某种“弯曲性”(见图5.29)。特别是,正如在闵可夫斯基空间中一样,空间--时间中的任一点都是一个光锥的顶点。但是这些光锥不像在闵可夫斯基空间中的那样以完全一致的方式排列。我们将在第七章的一些空间--时间模型的例子中看到这种明显的非一致性(参阅387页的图7.137.14)。物质粒子的世界线的朝向总在光锥之内,而光子的世界线总是沿着光锥。正如在闵可夫斯基空间中一样,沿着任何一条这样的曲线,总存在测量该粒子所经历的时间的闵可夫斯基“距离”的概念。正如在曲面的情形,这种距离测度定义了与平空间不同的曲面的几何 
      和上述的二维曲面情况相似,空间--时间中的测地线可有类似的解释。但是我们必须记住闵可夫斯基和欧几里德情形的不同之处。空间--时间中的测地的世界线取(局部)最大的距离(亦即时间),而不是取(局部)最小的长度。按照这一规则,引力作用下的自由运动粒子的世界线,实际上测地线。这样,尤其是在引力场中运动的天体可用测地线来描写。在空虚的空间的光线(光子的世界线)也是测地线,并且是具有“长度”的测地线21。我在图5.30中作为例子画出了地球和太阳的世界线的略图,地球绕太阳的运动是一根绕着太阳世界线的螺旋状的测地线。我也标出了从一个遥远的恒星到达地球的光子。因为按照爱因斯坦理论,光线被太阳的引力场所偏折,所以其世界线显得稍微有些“弯折”了。
     
      我们还要看看如何将牛顿的反平方律包括进来,并按照爱因斯坦相对论作何种修正。让我们回到在引力场中下落的粒子球面的例子上来。我们记得,如果球面围绕的只是真空,则按照牛顿理论,球的体积一开始不会改变;但是如果围绕的是一个总质量为M的物体,则会产生和M成正比的体积减小。这种规律在爱因斯坦理论中(对于小球面)刚好是一样,除了决定此体积减小的不完全是M,还有一附加的“通常非常小的”来自被围绕物质的压力的贡献。
      四维空间--时间的曲率必须描写在任何地方在任何可能方向运动的粒子的潮汐效应。它的完整数学表达式由被称为黎曼曲率张量的量所给出。这个东西是有点复杂,在每一点具有二十个称作分量的数。不同的分量是在空间--时间中在不同方向上的不同曲率。黎曼曲率通常写作Rijkl。但是因为我不想在这里解释这些小指标的意义(事实上也不想解释张量的意义),我就简单地将它写作
    黎曼
      存在一种将此张量分解成两部分的方法,第一部分是魏尔张量,第二部分是里奇张量(各有十个分量)。此分解可表达如下:
    黎曼=魏尔+里奇。
      (其具体表达式在目前并不特别有用。)魏尔张量魏尔是测量我们自由下落的球面的潮汐畸变(亦即形状的初始变形,而非尺度的变化),而里奇张量里奇测量其初始体积改变22。我们记得,牛顿引力理论要求下落球面所围绕的质量和这初始体积的减小成正比。粗略地讲,它告诉我们,物体的质量密度,或等效地能量密度(因为E=mc2)--应该和里奇张量相等
      事实上,这基本上就是广义相对论的场方程--也即爱因斯坦场方程--实际的断言23。然而,关于这些还有许多技术上的细节,最好不在这里纠缠。只要知道存在一个称作能量--动量的张量,它将有关的物质和电磁场的能量、压力和动量都组织在一起。我把这一张量叫做能量,则爱因斯坦方程可非常粗略地写作:
    里奇=能量。
      正是在能量张量中“压力”的出现以及为了使整个方程协调的条件要求,使得压力正如前述的也对体积缩小效应有所贡献。   此方程似乎没有牵涉到魏尔张量。但它是一个重要的量。在空虚的空间里感受到的潮汐效应纯粹是由魏尔引起的。事实上,上述的爱因斯坦方程意味着,存在将魏尔和能量相联系的微分方程,和该方程我们以前遇到的马克斯韦方程很相像24。的确,把魏尔当作用EB这一对量描述的电磁场量(实际上也是一个张量--马克斯韦张量)的引力类似物是一种富有成果的观点。在一定的意义上可以讲,魏尔实际上是引力场的测定。魏尔的“源”是能量张量。这和电磁场EB)的源是(pj),也即马克斯韦理论的电荷和电流的组合的情形很相似。这种观点将有助于第七章的讨论。
      如果注意到在爱因斯坦理论和牛顿在两个半世纪前提出的理论之间,虽然在形式和内在的观念之间有如此深刻的差别,但在观测上要找到差异却非常困难,人们会十分惊异。假如所考虑的速度和光速c相比较小很多,并且引力场不太强(使得逃逸速度比c小得多,参阅第七章388页),那么爱因斯坦理论的结果实质上和牛顿的一样。但是,在这两个理论的预言的确不同时,爱因斯坦理论更准确。现在已有几个印象深刻的实验,证明爱因斯坦新理论完全成立。正如爱因斯坦所坚持的,在引力场中钟走得慢一些,此效应以不同的方式得到直接的测量。光和无线电波的确被太阳所偏折,并被遭遇者稍微地延迟--也很好地检验了广义相对论效应。空间探测器和运动行星,正如爱因斯坦理论所要求的那样,对牛顿轨道要做小修正,这些也被实验所证实。(特别是从1859年起天文学家就开始忧虑的被称作“近日点进动”的水星运动的失常,1915年为爱因斯坦所解释。)也许最令人印象深刻的是,对一个包括一对微小的大质量恒星(假定为两个“中子星”,参阅388页)的称作双脉卫星系统上的一系列观测,其数据和爱因斯坦理论非常接近,并间接地证实了一个在牛顿理论中根本不存在的效应,即引力波的辐射。(引力波是电磁波的引力类似物,以光速c来传播。)还没有找到任何被确证的和爱因斯坦广义相对论相冲突的观测。正因为这种种奇异的现象,使我们坚信爱因斯坦理论是对的!
     
    相对论因果性和决定论
     
      我们记得在相对论中,物质不能运动得比光快--也就是说,它们的世界线必须处于光锥之中(参见图5.29)。(尤其在广义相对论中,我们必须用这种局部的方式描述事物。光锥并不均匀地排列着,所以讲非常的粒子的速度是否超过这里的光速并没有多大意义。)光子的世界线沿着光锥,但对于任何粒子都不能允许其世界线处在光锥之。事实上,更一般的陈述应是,不允许任何讯号在光锥外传播。
     
      要理解为什么这样,可以参考闵可夫斯基空间图(图5.31)。假定我们有一台能发出比光传播得更快的讯号的仪器。利用这台仪器,观察者W从他的世界线的事件A发出一到达遥远的事件B的讯号,B刚好处于A的光锥的下面。从W的观点看,可以画成图5.31a的样子。但从第二个观察者U的观点看,应重新画成图5.31b的样子,U正在进行着离开W(譬如讲,从AB之间的某点开始)的快速运动。对于U而言,事件B显得比A还更地发生!(正如前面(228页)提到的,这种“重画”是一个彭加莱运动。)从W的观点看,U的同时性空间看起来是“向上倾斜”的,这就是为何事件BU的观点看显得比A还早的原因。这样,对于U而言,W似乎是在往时间向后的方向上发出讯号!
     
     
      这还不算什么矛盾。但是如果还有一个从U的观点看对称的(由于狭义相对论原理),离开U以和W相反的方向运动并装备有与W一样的仪器的第三个观察者V,他也能发出一个刚好比光还快的讯号。从(亦即V的观点看,该讯号是向U的方向返回。从U的观点看来,这讯号又是发向过去,但这回是沿着相反的空间方向。V可以在接到到W发出的原始记号的B时刻发出第二个讯号到W去。从U看来,该讯号在比原先发射事件A更早的事件C处到达W(图5.32)。但比这更糟糕的是,实际上事件CW自身的世界线上比事件A更早,W在发出A讯号之前即经历了事件C!观察者V发回到W的讯号由于W的预先安排,可以简单地重复B处收到的。这样,W就会在自己的世界线更早的时刻收到后来想发出的同一个讯号!将两个观察者分隔足够大的距离,我们就可以使得返回讯号,比原始的讯号早一个任意长的时间间隔。也许W原始的讯号是说他折断了腿,他可在此事件发生之前接受到返回讯号,然后(假定)用他自己的意志,采取行动去避免事故发生!
      这样,先知先觉地发射讯号和爱因斯坦的相对论原理一道会导致和我们“自由意志”的正常感觉的严重冲突。实际上的情形比这还要更严重。因为我们可以设想,也许“观察者W”仅仅是一台机械仪器,它的程序是如果收到“不”的讯号时即发出“是”的讯号,反之亦然。而V也可以是一台机械仪器,如果收到“不”的讯号时即发出“不”的讯号,反之亦然。这就导致了和我们以前遇到的25同样的矛盾。现在似乎和观察者W是否有自由意志“无关”,并且告诉我们超光速讯号发射仪器不存在物理学上的可能性。这会在下面给我们带来一些令人困惑的推论(第六章330页)。
      让我们接受,任何种类的讯号--不仅仅是通常物理粒子所携带的--必须被光锥所限制。上面的论证实际上只牵涉到狭义相对论。但是在广义相对论中,这一个狭义相对论的规则仍然定域地成立。正是狭义相对论的这种局部有效性告诉我们讯号必须被光锥所限制,所以它也应该适用于广义相对论。我们将会看到这一点如何影响这些理论决定论的问题。我记得在牛顿(或哈密顿等等)理论中,“决定论”意思是说在一特定时刻初始值完全固定了其他时刻的行为。如果在牛顿理论中采用空间--时间的观点,则给定初始值的那个“特定时刻”即是四维空间--时间中的某一个三维“截面”(亦即那一时刻的整个空间)。在相对论中,不可能为此而挑出一个全局的“时间”概念。通常的步骤是采用一种更灵活的做法。任何人的“时间”都可以。在狭义相对论中,可采取某个观察者的同时面,并用此同时面来取代上述的“截面”以赋予初始值。但在广义相对论中,“同时空间”的概念并没有很好地定义。从而人们使用更普遍的类空面26的概念。我们在图5.33画出了这样的一个面;它的特征是处于它上面的每一点的光锥之外--这样,在局部上它和同时空间很相似。
     
     
      在狭义相对论中,决定论可以表述成为在任何给定的同时面S上的初始值,固定了整个空间--时间中的系统的行为的这一事实。(尤其是在马克斯韦理论中这一点成立--它的确是“狭义相对性”的理论。)然而,人们可以有更强的陈述。如果想知道处在S的未来的某一事件P处发生的事,则只需要知道S上某一(有限的)有界的区域内,而不必是整个S上的初始值即可。这是因为“信息”不能传递得比光还快,而S上的任何离得太远的以至于光讯号不能到达P的点不能对P有何影响(见图5.34。这实际上比在牛顿理论中出现的情形更令人满意。在那里,人们为了能对将来某一时刻要发生的事件作任何预言,原则上要知道整个无限的“截面”上发生的事。牛顿式信息的传播速度不受任何限制,牛顿的力是瞬息性的。
     
    广义相对论中的“决定论”比在狭义相对论中复杂得多,我在此只作少许评论。首先,我们为了赋予初始值必须使用一个类空面S(不仅仅是一个同时面)。人们发现,如果像通常那样假定对能量张量有贡献的物质场的行为是决定性的,则爱因斯坦方程的确给出了引力场的局部的决定性的行为,然而,这里事情相当复杂。空间--时间的几何自身--包括它的光锥的“因果性”结构--现在成为实际上要被确定的一部分。由于我们预先不知道光锥结构,所以不能得知S的那一部分为确定未来某一事件P的行为所必须。在某种极端的情况下,甚至有整个S都不够的情形,而因此就损失了全局的决定性!(这里牵涉到非常困难的问题,它们和一个在广义相对论中称为“宇宙监督”的末被证明的猜测相关。这猜测和黑洞形成有关系(参阅提普勒等1980年);参阅第七章388页以及389页处的脚注和396页。)情况似乎很可能是,和“极端”的引力场的情形相共存的“决定性失效”和人类尺度的事件几乎没有任何直接关系。但是,从这里也可以看出,广义相对论中的决定论的问题绝不像人们设想的那样干脆利落。
     
    经典物理的可计算性:我们的立场如何?
     
      我在这一章从头到尾总是同时留心和决定论不同的可计算性的问题。我并且试图指出,在谈论到“自由意志”和精神现象时,可计算性的问题至少和决定论性的问题一样重要。但是,正如我们不得不相信的那样,在经典理论中决定论本身也不是那么清楚的。我们看到了带电粒子,运动的经典洛伦兹方程所引起的一些困扰的问题。(回忆狄拉克的“逃逸解”。)我们还注意到,在广义相对论中存在一些决定论的困难。在这些理论中,只要没有决定论,当然也就不可计算了。然而上面引用的情形中似乎没有一种因为缺乏决定性而和我们有许多直接的哲学方面的关系。在这些现象中还是没给我们的“自由意志”留下余地:在第一种情况,因为点电荷的经典洛伦兹方程(正如狄拉克解决的那样)被认为在提这些问题的水平上在物理上不合理;第二种情况,由于经典广义相对论所引起的这些问题(黑洞等等)的尺度和我们自己大脑的尺度差别太大。   现在,我们在经典理论中关于可计算性的境况如何呢?可以合理地猜测,如果超越了我刚才提出的因果性和决定性的差别的话,则广义相对论中的情形和狭义相对论不会有大的差别。任何在物理系统的未来行为被初始值所决定的地方,用我们在牛顿理论情况下类似的推论,则其未来的行为似应也被那些数据可计算地决定27(除了上面考虑过的,玻--埃勒--里查德遭遇到的波动方程的不可计算性的“不帮忙的”非可计算性的类型--这种情况对于光滑地变化的数据不会发生)。的确,在我迄今讨论过的任何物理理论中,很难看到任何重大的“不可计算”的因素。可以肯定预料到的是,在这许多理论中会发生“混沌的”行为,只要初始数据作非常微小的改变,就会对结果的行为产生巨大的影响。(看来在广义相对论中真是如此,参阅米斯纳1969,别林斯基等1970。)但是,正如我在前面所提到的,很难看出类不可计算性亦即“不可预言性”对要“驾驭”物理定律的可能的不可计算因素的仪器有何“用处”。如果“大脑”可以任何方式利用不可计算的因素,那么这种因素必须是非经典物理的。我们必须在浏览了量子理论之后,重新回来审查这个问题。
     
    质量、物质和实在
     
      让我们简略地清查一下经典物理所呈现的世界图像。首先空间--时间,担任着主要任务:提供舞台给所有不同的物理现象。其次是任意不停活动着的物理对象,但这些活动由精密的物理定律所约束。共有两类物理对象:粒子和场。关于粒子,除了各个都有自己的世界线以及具有各自的(静)质量和也许还有电荷等,我们很少提到它们的实际性质或特殊品质。另一方面,场的特性非常明确--服从马克斯韦方程的电磁场,以及服从爱因斯坦方程的引力场。   在处理粒子时存在一种互相冲突的情形。如果粒子的质量是如此微小,以至于其对场的影响可以忽略,则可称作检验粒子--而它们对场的响应的运动是毫不含糊的。洛伦兹力定律描述检验粒子对电磁场的响应,而测地线定律描述它们对引力场的响应(如果两种场都存在时,是上述情形的适当的结合)。这些粒子在这里必须被认为是粒子,也就是具有一维的世界线。然而,当粒子对场(并因而对其他粒子)的效应必须考虑时--亦即,这些粒子成为场的时--那么该粒子必须认为是在某种程度上在空间中散开的对象。否则在每个粒子的紧邻处的场会变得无穷大。这些散开的源为马克斯韦方程提供了所需要的电荷--电流分布(ρ,j),也为爱因斯坦方程提供了所需要张量能量。除此之外,所有这些粒子和场所处的空间--时间具有直接描绘引力的可变的结构。“舞台”参与到在它上面表演的情节中去!
      这就是经典物理在有关物理实在的性质方面给我们的教导。很清楚,我们在中学学到了许多,但同时我们又不可过于自得,以为我们一时形成的图像不会被某种以后更深刻的观点所推翻。我们在下一章会看到,甚至相对论所带来的革命性变革在与量子力学相比较时都会显得黯淡无光。但是,我们和经典理论以及它对物质实在的描述方面缘份还未尽。还有件使我们惊奇的事!
      什么是“物质”?它是实际的物理对象,亦即世界的“东西”由之构成的实体。它是你、我以及我们的房子由之所组成的材料。如何量化物质?初等物理教科书为我们提供了牛顿的清楚的答案。它是一个对象或一群对象的质量,它是所包含的物质的测度。这看来的确是对的--没有任何其他的物理量能在作为总物质的真正量度这一点上和质量认真地作较量。况且它是守恒的:任何系统的质量,也就是物体内容的总量总是保持不变。爱因斯坦著名的狭义相对论中的公式
      E=mc2
      还告诉我们质量(m)和能量(E)是可以互换的。例如,一个铀原子会衰变分裂成小块,如果能够使这些小块处于静止,则这些小块的总质量会比原来铀原子的质量小;但是若把每一块的运动的能量--动能(参阅190)--也计算在内,再除以c2(因为E=mc2)以转化为质量值,则我们发现总量实际上是不变的。质量的确是守恒的,但由于部分是由能量组成,它作为实在物质的量度显得不那么清楚了。能量毕竟依赖于物质运动的速度。一列直达列车的运动的能量相当大。但是如果我们刚好坐在此火车上,则按照我们自己的观点火车根本没有运动。(虽然单独粒子的杂乱运动的热能不会),但运动能量会因为适当地选择观点而被“减少到零”。一种称作π0介子的次原子粒子的衰变是一个鲜明的例子,爱因斯坦的质量--能量关系的效应在这场台达到了极致的程度。它肯定是一种具有定义得很好的(正的)质量的物质粒子。大约10-16秒之后,它几乎总是分解(像上述的铀原子那样,但要更快速得多)成仅仅两个光子(图5.35)。从和π0介子一起处于静止的观察者看来,每个光子携带走一半能量,这的确是π0介子质量的一半。然而这光子“质量”具有一些模糊的性质:它是纯能量。如果我们能在一个光子的方向上快速地运动,我们就能将其质量--能量要减小到什么程度就减小到什么程度--光子的内禀质量(或正如我们很快就要讲到的质量)实际上为。所有这一切为质量守恒描绘出一幅协调的图像,但是它和我们过去的不完全一样。在某种意义上,质量仍是“物质的量”的测度,但在观点上有显著的改变:既然质量等效于能量,那么系统的质量,正如能量那样依赖于观察者的运动!
     
      
      
      值得花时间将我们得到的观点表述得更明白一些。取代质量作用的守恒量是叫能量--动量四矢量的整体。在闵可夫斯基空间中可把它画成从原点O出发的一个箭头(矢量),它指向O点未来光锥的内部(或者在光子的极端的情况下,处于光锥之上);见图5.36。这个和物体世界线指向一致的箭头包含有能量、质量和动量的所有信息。这样,此箭头端点在某观察者座标系中测量的“t-值”(或“高度”)表示观察者看到的,物体的质量(或能量除以c2),而动量(除以c)由其空间分量所提供。
      这个箭头的闵可夫斯基“长度”是称为静质量的重要的量。它描述和此物体同处静止的观察者所看到的质量,人们也许会采取将当作“物体的量”的好的量度的观点。然而,它没有可加性:如果一个系统分裂成两半,则原先的静止量并不是结果的两个静质量的和。回想一下π0介子衰变的情形。π0介子具有正的静质量,而分裂成的每个光子的静质量为零。但是,可加性对于整个矢量,(四矢量)的确成立,我们现在必须在画在图5.36中的矢量加法定律的意义上进行“相加”。现在我们“物质的量”正是用整个箭头来测量!
      让我们现在考虑马克斯韦电磁场。我们知道它携带能量。按照E=mc2,它还应该有质量。这样,马克斯韦场又是物质!由于马克斯韦场非常密切地参与到将粒子捆绑在一起的力中,所以这一点我们肯定必须接受。在任何物体中的电磁场一定对其质量有重要的贡献28
      关于爱因斯坦引力场又如何呢?在许多方面它和马克斯韦场很类似。和在马克斯韦理论中的运动带电体会发射电磁波相似,运动的大质量物体(按照爱因斯坦理论)也会发射出引力波(参看242页)--它正如电磁波一样以光速传播并携带能量。然而,此能量不是以标准的方式测量的,它是前面讲到的张量能量。在(纯粹)引力波中,此张量实际上处处为!尽管如此,人们可采用如下观点,空间--时间的曲率(现在全部由张量魏尔给出)多多少少能代表引力波中的“东西”。但是引力能是非定域的,也就是说,人们不能靠考察一个有限区域的空间--时间曲率来决定能量的度量。引力场的能量--并因此质量--的确是非常滑的鳝鱼,我们无法将其钉死在任何清楚的位置上。尽管如此,我们必须严肃认真地对付。它肯定在那里,必须把它考虑在内才能使质量的概念在大范围内守恒。已找到一个可用于引力波的好的(并且是正的)质量测度(邦迪1960,萨克斯1962),但它的非定域性变成这种样子,在两次辐射爆之间的空间--时间的平坦区域中(和飓风眼中的静区很类似)此测度有时为非零,在该处其实完全没有曲率(参阅彭罗斯和林得勒1986427页)(亦即魏尔里奇均为零)!在这种情形下,我们看来不得不做出结论,如果此质量--能量必须存在某处的话,则应该处于这个平坦的空的空间中--一个完全没有任何种类的物质和场的区域。在这些古怪的情形下,我们“物质的量”或者在那里,在此空的区域中的最空虚之处,或者根本那里也不在!
      这看来纯粹是佯谬。然而,它正是我们最好的经典理论--们也的确是超等的理论--所告诉我们关于世界的“实”物质的性质。按照经典理论,且不必说我们即将探索的量子理论,物质实体比人们所设想的更模糊得多。它的测量--甚至它是否存在--很清楚地依赖于一些微妙的症结,并且不能仅仅定域地确证!如果这种非定域性都使人迷惑不解的话,我们还要准备迎接更大打击的来临。
      1.一个显著的事实是,所有确立的和牛顿图像的偏差都以某种基本的方式和的行为相关。首先,存在马克斯韦理论中的脱离物体的携带能量的场。其次,正如我们就要看到的,光速在爱因斯坦狭义相对论中起着关键的作用。第三,只有当运动速度和光速可相比较时,爱因斯坦广义相对论和牛顿引力论的微小偏离才变得显著。(太阳引起的光偏折,水星运动,在黑洞中和光相比较的逃逸速度等等。)第四,首先是在光的行为中观察到量子力学中存在的波粒二象性。最后,还有量子电动力学,它是带电粒子的量子场论。可以合情理地猜测,牛顿本人已经准备接受他的图像的躲藏在光的神秘行为后面的深刻问题。参阅牛顿(1730);还可参阅彭罗斯(1987a)。
      2.有一个美妙的、很成功的物理理解的实体--亦即卡诺、马克斯韦、开尔芬、玻尔兹曼等等的热力学--我在分类时忽略了它。这可能引起某些读者的困惑,但我是故意这么做的。因为某种在第七章会变得更清楚的原因,我本人非常犹豫是否将其归于超等理论的范畴中。然而,许多物理学家也许会认为把这么漂亮的根本的观念放到低到仅仅有用的范畴是亵渎神物!依我看来,热力学按通常的理解是某种仅适合于平均的东西,而不适合于系统中的每一个别部分--部分的原因是由于它为其他理论的推论--在我这里的意义上不是一个完整的物理理论(这同时适用于作为其数学基础的统计力学的数学框架)。我以此事实作为借口以回避这一问题,把它们一块放到分类之外,正如我们在第七章将会看到的,我宣布在热力学和在前面已经提到的属于有用的范畴的大爆炸标准宇宙模型之间存在一种紧密的联系。我相信,在这两组观念之间(现在还缺一部分)的某种联合,在必需的意义上,甚至会被认为属于超等的范畴的物理理论。这是我还要在后面论述的内容。
      3.我的同事们问我应将“扭量理论”归于何类。这是一种观念和技巧的精心集合,我自己曾为此花费了许许多多的心血。就扭量理论作为物理世界的一个不同理论而言,它只能被收到尝试的范畴中。
      4.然而,伽利略经常用水钟来为其观察定时,见巴博(1989)。
      5.用牛顿的名字来命名这个模型--的确就“牛顿”力学总体而言--仅仅是一个方便的标志。牛顿自身对于物理世界的实际性质的观点似乎不像这么独断,而是更微妙,更难以捉摸。(最有力地促进这一“牛顿”模型的人要算R.C玻斯科维奇1711--1787)。
      6.拉飞逸·索金曾向我指出,存在一种意义,在这种意义上,可用一种和对(譬如讲)牛顿系统所用的相似的方式来“计算”此一特殊的玩具模型。我们可摹想一个计算序列C1C2C3…,这些步骤允许将系统的行为计算到越来越后而没有时间的极限,并且不断增加精确性(参阅198199页)。在现在情况下,为了达到这个目的,我们可允许将图灵机动作Tum)进行N步定义为CN,如果这一动作那时还不停止则“认为”Tu(m)=□。然而,在Tum=□的地方,由引进牵涉到诸如“对所有的qTq)停止”的双重量化的陈述的演化,不难修正我们的玩具以战胜这类“计算”。(存在无限多对相差为2的质数的未解决问题即为这样的陈述的一个例子。)
      7.正如第四章(169页注9)提示的,新的柏龙--沙柏--斯马勒(1989)理论可提供一种在数学上更能接受的方法来解决其中的一些问题。
      8.伟大的意大利/法国数学家约瑟夫·L·拉格朗日(1736--1813)大约比哈密顿早24年左右就知道了哈密顿方程。他虽然和哈密顿观点不一样。更早时期的一个同等重要的发展是力学的欧拉�拉格朗日方程的表达形式。这样牛顿定律可认为是从一个更高的原则,即最小作用量原理P.L.M德毛帕裘斯)推导而来。除了其伟大的理论意义之外,欧拉--拉格朗日方程还提供了具有显著威力和实用价值的计算步骤。
      9.刘维尔相空间体积只是整族具有不同维数的在哈密顿演化下保持不变的“体积”(称作彭加莱不变量)之一。但是,我的这个断言如此之囊括无遗实在有些过分,我们可以想象一个系统,将其中我们不感兴趣的一些自由度(对某些相空间体积有贡献)“倾倒”到某处去(诸如逃到无穷处的辐射),这样我们感兴趣的部分的相空间就会减小。
      10.这第二个事实尤其是科学的极大的幸运。因为没有它的话,巨大物体的动力行为就不可理解,而大物体行为几乎不能给精确适用于粒子本身的定律提供任何暗示。我猜想,牛顿之所以那么强调他的第三定律的原因在于,如果没有它,则从微观到宏观的动力行为的传递就不成立。
      另一个对于科学发展生死攸关的“奇迹般的”事实是,反平方律是仅有使围绕着中心物体的一般轨道具有简单的几何形状的方次律(随距离而减小)。如果定律或力是倒数律的或反三方律的,开普勒还会有何成就呢?   11.我已为各种场选好了单位,以使和马克斯韦的密先的方程的形式相接近(除了他的电荷在我处为c-2ρ以外)。当用其他的单位制时,因子c的分布将会不同。
      12.事实上,我们具有无限多的XiPi更复杂之处在于,我们不能只用这些场的值作为座标,必须引进某种马克斯韦场的“势”才能纳入到哈密顿理论的框架中去。
      13.也就是说,不过两次可微的。
      14.洛伦兹方程告诉我们,由电荷所处的地方的电磁场引起了作用于它上面的;如果它的质量又是已知的,牛顿第二定律就告诉我们该粒子的加速度。然而,带电粒子经常以近于光速的速度运动,狭义相对论的效应变得很重要,影响了实际上应取的粒子质量数值(见下一节)。正是这种原因使作用在带电粒子上的正确的力定律推迟到狭义相对论的诞生才被发现
      15.事实上,自然界中的任何量子粒子,在某种意义上,整个自身都像一台这样的钟。正如第六章要讲到的,任何量子粒子都和一个振动相关系,其频率与质量成比例;见265页。现代最精确的钟表(原子钟、核子钟)归根到底是依赖于这个效应。
      16.也许读者会忧虑,由于旅行者世界线在B处出现了一个“角”,正如图示的,他在事件B处遭受到无限大的加速度。可以用有限的加速度将他的世界线在B处的尖角弄圆滑,这只不过把他所经历的由整个世界线的闵可夫斯基“长度”所测量的总时间稍微改变一点。
      17.这些就是M依照爱因斯坦的同时性定义,由从M发出并被问题中的事件反射回到M的光讯号判断的事件空间。例如,见林德勒(1982)。
      18.这是该形状的初始的对时间的二阶微分(或“加速度”)。形状的改变率(或“速度”)在初始时为零,因为球面在开始时刻是静止的。
      19.杰出的法国数学家埃利·卡当(1923)首先对牛顿理论的数学形式重新进行表述--这当然是在爱因斯坦的广义相对论之后
      20.在这种意义上的局部的欧几里德性的弯曲空间称作以伟大的贝纳德·黎曼(1826--;1866)命名的黎曼流形。他在高斯的某些更早的有关的两维情形的工作之后,首先研究这类空间。我们在此需对黎曼观念作重大的修正,也即允许几何为局部闵可夫斯基的,而不是欧几里德的。通常将这种空间称为洛伦兹流形(属于所谓的黎曼或更不逻辑点的黎曼流形的一类)。
      21.或许读者会忧虑,零值何以代表“长度”的最大值!事实上的确是如此,只不过在空洞的意义上而言:零长的测地线的特征是,没有任何其他的粒子的世界线可将其上面的任何一对点(局部地)连接。
      22.畸变效应和体积改变的分解事实上不像我所表达的那么明确。里奇张量本身会引起一定量的潮汐畸变。(对于光线而言,这种分解完全明确的;参阅彭罗斯和林德勒(1986),第七章)例如可参阅该书第240210页关于魏尔和里奇张量的精确定义。(德国出生的赫曼·魏尔是本世纪一位杰出的数学人物;意大利的格里高里·里奇是一位有巨大影响的几何学家,他在上世纪奠定了张量理论。)
      23.大卫·希尔伯特在191511月发现了实际方程的正确形式,但该理论的物理观念则完全归功于爱因斯坦。
      24.对于通晓这些东西的读者而言,这些微分方程正是用爱因斯坦方程代入到完整的比安基等式而得到的。
      25.存在某些(虽然不是非常令人满意的)方法可绕过这个论证,参阅惠勒和费因曼(1945
      26.因为它不是二维的,而是三维的,所以在这里用术语“超面”比“曲面”在技术上更为合适。
      27.有关这些问题的严格定理一定是非常有用的,并且非常有趣,可惜迄今还没有得到。
      28.现在这个理论是不可计算的,它的(临时的)毫无用处的答案是无限大。
     

    xian.name  All rights reserved.
     

    No comments:

    Post a Comment