Monday, August 18, 2014

expectation 细致平衡(Detailed Balance),意味着任何两种状态之间的期望(volatility)流量相等; 如果这条曲线不是平滑连续的,比如有很多不规整跳跃,微积分就失效了。


 
 
微观可逆性
智悲佛网
世界 你从何处来
作者:圆浩法师,原美国田纳西大学化学系博士后。
 

序言 为什么谈论世界观
 
我们对于生存的世界,以及自己本身的存在,多多少少都会有一个基本的见地。不论这个见地是怎么建立的,来自家庭熏陶,或学校教育,乃至整个人文环境的影响,更或者某次偶然的经历,一旦这个见地建立了,它将自然而然地渗透到种种日常行为当中,并指导生命中的任何重大决定,以及决定死亡时采取什么方式作最后的告别。这个基本的见地就是世界观。
 
佛陀曾告诉我们,在无明的支配下,人由各种情绪引发八万四千烦恼,最根本的烦恼可概括为十种。在这十大根本烦恼中,除了贪嗔痴慢疑,剩下五个都和见地有关。也就是说,如果在最根本的见地上出了问题,那烦恼就会像汹涌的波涛般无法止息。
 
那么,最根本的见地是什么呢?就是如何认识生命。到底该如何树立呢?这是个有关生命本质的疑问。一个很现实的问题是,人死之后,到底有没有来世?答案只有两种:或者生命随着肉体的消亡而消亡,或者生命将舍弃现有的肉体而继续流转。
 
这个问题具有现实意义的原因是,如果确信生命只有此世,人死如灯灭,那么就如同确信没有明天,大可今朝有酒今朝醉。所有的奋斗目标,只为了去追逐眼前的利益,而所有的理想楷模也只是此生圆满富足、功成名就的人。随之而来的还有两个信条:或者确信只要自己勤奋努力,一定会像他们一样;或者埋怨生长环境、人文环境,乃至社会体制等种种客观因素使自己的理想不能实现,自己的欲望不能满足。人们大多时候在这两个信条之间摇摆。很遗憾,世间大部分是这一类身心贫乏的人。
 
相反,如果确信有来世,生命将不断流转,那也如同确信有明天一样,现在做的事情不得不为明天考虑,就需要一个长远的计划来安排当下的生活。更重要的是,因为确定有来世,就必须去了解,生生世世的流转机理是什么?只有相应于这个机理,才能从现在开始,为一个美好的来世而努力。否则所作所为很可能把自己带入烦恼更加炽盛、痛苦更加不堪的来世。
 
因此,树立一个正确的世界观至关重要。特别在这个年代,自然、人为灾难频频发生,倘若还没来得及深挖我们的见地,就稀里糊涂死掉了,而恰好有个更加惨不忍睹的后世在迎接自己,那时的懊悔与恐怖必定会无法言喻。
 
1.轮回
 
轮回,梵语“流转”之意。转世之说不仅仅存在于印度的古老宗教,在中国,道教也承认转世,比如老子有八十一化。另外,在东汉、三国、六朝和唐朝的典籍里,都有转世之说的记载。
 
《太平广记》记载,一个叫刘三复的人,能记三生事。曾为马,伤蹄则心痛。转世为人,乘马至硗确之地必缓辔,有石必去。古希腊的哲学家也相信转世论,如柏拉图在《费多》和《理想国》里都有提及。据说毕达哥拉斯是第一位深入发展转世概念的哲学家。在古老的玛雅文明中,也阐述了死并不是人生的终点,只不过是新旅程的开始。
 
在以千万年为单位的无尽循环的历史长河中,玛雅人认识到生与死都如同朝露般短暂,并且他们相信依照生前的善和恶,死后会进入天堂或堕入地狱。现代盛行的天主教、基督教、伊斯兰教等,亦相信遵从上帝或真主的旨意行善,可以在死后前往上帝的天堂。
 
由此看来,除了近三百多年来伴随着工业革命、世界大战而兴起的现代科学,大部分宗教信仰是承认有来世的。其实在佛陀年代唯独有一个教派不承认来世,叫作顺世外道。据说诸位大智者、大成就者,都认为这种观点太下劣,而不会花太多篇章去破斥。当今时代科学所立足的基本见地,最接近于当年顺世外道的观点。
 
因此,本文接下来会先列举一些转世的证明,然后给出佛陀对于轮回的教言。最后再分析现代科学发展到今天,在描述世界和生命的真相这一至关重要的问题上,所遇到的种种局限和一些启示,以此来审思我们内心的见地,是否真正相合于真理。
 
2.现代的转世证明
 
对于任何一个现象,无论是科学或哲学命题,证明它不存在往往要比证明它存在困难千万倍。因为前者要把所有可能存在的情形逐个破除,而对于后者,只要寻找到一个实例,就算完成了存在的证明。对于转世或者生命不息的证明,从古至今已有很多公案,涉及到未成年人、成年人,宗教徒、非宗教徒,佛教徒、非佛教徒……大量实例不胜枚举。
 
堪布慈诚罗珠仁波切在《前世今生论》中举出的回忆前世的案例,全部都有当时的见证人,可以说是铁一般的事实,不容狡辩。而近代西方盛行的濒死体验,也客观地证明了肉身之外,还有一个叫做灵魂、意识、神识的,可感知的生命体存在,而且它曾经经历了或者正在踏上现存的肉身完全不可能跟随的旅途。
 
美国盖洛普(Gallup)公司在1992年的统计调查表明,仅在美国就有130万人有濒死体验的经历;德国2001年一次2000人的抽样调查表明,在本国人口中有濒死体验的比率是4%;而荷兰的一次长达13年的调查发现,344名心脏病猝发病人,从昏迷状态中清醒过来后,确定经历了濒死体验的有8~12%,其中有18%知道在他们被认定临床死亡后发生了什么事(Lancet, Dec 15, 2001);另外,肯耐斯·瑞恩博士等人的研究更表明有大约35%的人,接近死亡时有濒死体验。
 
很多有濒死体验的人能精确描述,在他们临床死亡时,在感觉器官不起任何作用的情况下看到的周围事物。很少有人否定濒死体验的存在,即使是无神论者。海明威19岁在意大利前线的救护车队服役时,曾有过一次灵魂离体的经历。当时是191878的午夜时分,一枚弹片击中了海明威的双腿,使他身受重伤。事后他告诉他的朋友盖伊·希科说:我觉得自己的灵魂从躯体内走了出来,就像拿着丝手帕的一角把它从口袋拉出来一样。丝手帕四处飘荡,最后终于回到老地方,进了口袋。
 
德国伟大诗人歌德、法国批判现实主义作家莫泊桑、俄国19世纪著名作家陀思妥耶夫斯基、美国著名小说家爱伦坡、英国著名作家劳伦斯等,都曾有过类似的体验。他们认为:人的灵魂藏于肉体之内,而且是肉体完美的复制品,由极轻的东西组成,发光、半透明、十分适合于进行体外的活动,灵魂离开身体时,跟做梦差不多。
 
雷蒙·穆迪(Raymond Moody)博士在他的一本书《光亮之外》(The Light Beyond)提到了一个九岁女孩的濒死体验,她在一次阑尾手术中失去知觉,被抢救过来以后,她回忆道:我听见他们说我的心跳停止了,我发现我飘在天花板上往下看,我从那儿可以看见所有的东西,然后我走到走廊上,我看见我妈妈在哭,我问她为什么要哭,但她听不见我,医生们认为我死了。然后一位美丽的女士走到我面前想帮助我,因为她知道我害怕。我们走过一条隧道,隧道又黑又长,我们走得很快,在隧道的尽头是很亮的光,我感觉非常愉快。
 
目前有关濒死体验的科研论文、专著、网站层出不穷,比如濒死体验研究基金网站专门列出种种研究成果,并鼓励更多的人把自己的濒死体验发布在网站上。为了确保这些体验是真实经历而非凭空捏造,网站会要求发布者先填写一个一百问的调查试卷。《后世的证明》(Evidence of the Afterlife)一书正是基于这些素材而出版的。
 
濒死体验的种种证据给医学家、心理学家、物理学家和哲学家提出了许多具有挑战性的问题。如:人的灵魂是永存的吗?人的意识产生于大脑吗?人的善恶行为有记录有后果吗?人生的目的是什么?不管科学家怎么解释,绝大多数濒死体验经验者的世界观都发生了重大的变化,这是一个令人深思的现象。
 
3.佛陀的教言
 
“佛”就是觉悟的意思,就像从混乱的梦境中醒来一样,是完全的、绝对的、最究竟彻底的觉悟,因而也叫大觉。作为佛陀的追随者,相信前世后世之流转,以及轮回中因果不虚的法则,是佛陀证悟并开示于我们的最根本的见地,也即一个佛教徒的世界观。有了这个见地才能真正了知苦及苦因,从而生起出离轮回的意乐,趋入诸位智者证悟的道,乃至获得涅槃的大自在。
 
那么,当年佛陀是如何给世人证明前后世存在的?《楞严经》第二卷首段所记载的佛陀与波斯匿王的对话,很明确地回答了这个问题。
 
波斯匿王问佛:我在未受佛教化之前,曾听说,此身死后,一切都断绝灭亡,即是无因无果,没有后世,这样就叫做不生不灭的涅槃法。我现在虽然遇到佛教化,但此心还有狐疑,是不是真的死后都没有了?怎样才能证明这个真心自性,确是不生不灭?”
 
佛对波斯匿王说:你相信外道,死后断灭,但我不问你死后事,就问你现在之事。你这个肉身,是同金刚之坚固、永远不变坏,还是会腐朽变坏呢?王答:世尊,我这个肉身,终归会变坏毁灭的。
 
佛说:大王,你身还未曾变灭,怎能知道将来必定会变坏灭亡呢?王答:世尊,我这个无常而随时变坏的身体,现在虽然还没有变坏,但是当我仔细观察,现前的情形,是念念变迁,前念灭,后念生,如波浪一样,一波起,一波灭,时时刻刻都在变迁谢落。因此我坚决地相信,这无常变坏之身,一定会终归灭亡的。
 
佛又对大王说:你看到变化,迁移不停,就领悟到身体一定会灭亡。但在变迁的过程中,你能知道一个不生灭的自性存在吗?王答:我实在不知道。佛说:你既然不知道,我现在就指示你,这个不生灭的自性。
 
佛再问:你二十岁时,身体衰于十岁;乃至现在,随著年月的变迁,更加衰坏。但当你三岁的时候,看见恒河,到十三岁的时候,再看见恒河,它的水又怎样呢?王答:那河水还同我三岁的时候一样,直到现在,亦没有变样。
 
佛再问:你现在自悲衰老,发白面皱。但是你观看河水的见性,和童年时观看河水的见性,是否有童耄呢?是否有变动衰老呢?王答:世尊,一点都无变异。
 
佛说:你的身体面貌,虽然衰皱,但这个能见的见精自性,并未曾衰皱。所以知道,能变皱者才是变,见性不变,就不会皱。会变坏当然有生灭,那个不变坏的,自然无生灭。原无生灭的见性,云何会在你身中,受你能变之身一同生死呢?因此应该知道,能变之身虽坏,真性是常存的。为何要引彼诸外道,都说此身,死后完全灭亡呢?
 
王听见佛所说,才相信此身死后不致断灭,只是舍这个生,而再趣别个生。这样他断灭的疑心终于被解除了。
 
4.科学的局限与启发
 
不幸的是,我们没有生在佛陀那个年代,或者确切地说,往昔我们没有依照佛陀的教导而觉悟,所以在如今这个纷繁复杂、五光十色的时代里,不得不再度思考我们的见地这个最基本的问题。毫无疑问,我们大多数人在所谓科学的熏陶下成长,并切身体验到科学带来的种种便利。很大一部分人以此觉得这个时代比古代优越多了,现代人通常会有这种相对于古人的傲慢。或者更近一点说,当我拿着iPad在机场登机时,肯定不愿意回到我的父辈那个在布满石头的小路上骑自行车颠簸的年代。
 
但与此相反,也让我们不得不面对的是,现代人的生活就像上紧的发条一样,已经失去了“采菊东篱下,悠然见南山”的悠闲,现代人的焦虑和压抑是古人无法想象的。这就是一个很现实的问题:科学到底会把我们带到哪里?
 
本文试图分析,科学发展到今天所面临的种种局限,以及对于如何建立世界观的一些启发。以下总体的分析思路,是以作者有限的知识为出发点,但其中提到的任何学术观点,都为科学界认可且有据可查。
 
4.1科学的见地或出发点
 
1972年,诺贝尔物理学奖得主安德森(P.W. Anderson)结合另一位著名物理学家威斯科夫(V.F. Weisskopf)的观点,在《科学》杂志上发表了一篇文章 (More Is Different, Science, 177, 4047),来阐述科学研究的基本出发点与实际的偏离。文中首先给出威斯科夫的观点:现代科学发展可明显分为两个趋势:深度研究和广度研究。
 
其中深度研究在于探索基础原理,比如核物理;而广度研究则是把已有的基础理论迅速应用于新的领域去解释未知现象或发展新应用,比如固态物理、等离子物理,乃至生物学,它们的理论基础源于核物理。
 
科学家或国家政府,往往在广度研究上比深度研究投入更多精力。安德森接着说,在人们的想象中似乎有这样的科学架构:从简单系统得到的理论知识可以应用于复杂系统。
 
比如对基础粒子的了知可以应用于多粒子系统,而多粒子系统的知识可应用于普通物理,再从普通物理到化学,从化学到分子生物学、细胞学,甚至最后推到心理学和社会学。这个过程在学术上叫归约化。
 
安德森根据自己的经验说,对基础粒子物理研究得越多,就越发现我们从中得到的理论,与其他科学或者社会学相关甚少,根本不能解决实际面临的问题。对于科学研究,当一个系统尺度变大后,它将又是一个全新的系统,有待于重新认识。马克思曾说,事物的发展是从量变到质变,这个过程用数学公式,很难跟踪或统一描述。
 
然而在过去一个世纪,科学确实建立了这种基本架构,试图用人类有限的基于简单系统的知识去研究复杂的自然和社会,甚至深广无边的宇宙。比如牛顿经典物理学、量子力学作为基础理论,代表了物理史上两个辉煌的时代,它们都试图用数学公式来描述地球和宇宙的基本法则,而且也确实使现代文明大大迈进。但至今让人争论不休的是:这些数学公式里并没有表达时间的不可逆性,也就是说,只要某种条件成立,经典和量子物理都允许时间回到过去,融化的雪人可以复原。这样的时间机器真的存在么?这仍然是现代科学要回答的问题。
 
威斯科夫还说过一句话,人类的存在基于两点:慈悲和知识。没有知识的慈悲是无用的,而没有慈悲的知识是非人道的。作者认为它恰如其分地表达了现代科学的迷茫。(Human existence is based upon two pillars: Compassion and knowledge. Compassion without knowledge is ineffective; knowledge without compassion is inhuman.)
 
4.2基础理论的缺失
 
4.2.1对称破碎
 
对称破碎描述这样一种现象:当一个稳态系统接近极限点时,一个微小的,或者无限小的扰动会决定这个系统以后新的状态。理论上这个系统可产生的结果不唯一,它们具有对称性,但扰动只会促使一个结果出现,而这个结果是随机出现的,理论无法预测。
 
用日常生活来解释,在一个尖尖的山顶上放一个球,这时球具备对称性,但是它不稳定,突然一阵微风或者一声尖叫,球会掉落山底,于是对称性就被打碎了,因为它掉落的方向是单一的,随机不可预测。这个观察看上去很无聊,然而对称破碎在微观世界里很重要。因为量子力学遵循对称性,它给出量子化的能级和能级的叠加态,以及这些叠加态发生的概率,并确保可观测值的稳定性。
 
对称性破碎意味着某种程度上量子理论的失效。上述山顶的例子恰恰是用来解释某些粒子现象的,此山在数学上叫墨西哥帽势能(the Mexican hat potential)
 
1957年李政道和杨振宁因发现在弱交互作用下对称破碎(宇称不守恒,parity,左右对称),并推测其为普遍性的基础科学原理,而获得诺贝尔奖。2008年诺贝尔物理学奖颁给了两位日本科学家和一位日裔美国籍科学家,因为他们发现了分别在强和弱的交互作用下对称性破碎的机理。这也恰恰说明目前科学仍在与对称性这一高深莫测的命题奋斗。
 
事实上,从目前人们可以认知事物的角度看,自然界很多奇特景象、美丽的图案,都可能是在对称性破碎的状态下随机出现的。甚至把一杯水烧开,或者凝结成冰,这个相变的过程也离不开对称性破碎。
 
如前所述,科学家试图从简单到复杂来研究这个世界,在对称性破碎这一事实前,这个见地失败了。我们或者承认这个世界有随机产生的可能,或者承认科学的缺失。当然科学家仍然在不辞辛苦地寻找出路。
 
对称性破碎不只限于微观世界,它在宏观世界也被广泛地研究。比如针对经济涨落或发展,有人推测为什么看上去宏观指标都相似的两个区域,最终也会发展成一个富有、一个落后。人们可以从各方面找原因,勤劳或懒惰,是否具备企业精神、地理因素、气候等等。但对称性破碎要传达的一个核心概念是,一个看似均一平等的状态,会因为看上去不相关因素的微小变化,而出现显著差异。从这点来说,很多经济学家建立数学模型的努力,也许是徒劳的。
 
佛陀早在两千多年前就教导我们,诸法因缘生,诸法因缘灭。在漫长的轮回中,因果丝毫不虚,如是因必得如是果。佛陀又告诫我们,即使是阿罗汉或者登地菩萨,想要洞彻种种前因后果,以他们的智慧也是不可能的,更何况凡夫。
 
佛陀虽然彻底了知世界上任何一个现象的缘起,包括孔雀的羽毛为何有若干颜色,一棵树上的叶子有多少……但他不会为弟子宣讲这些,因为与解脱无关。佛陀只会宣讲令众生从无明黑暗中觉醒的法门,而觉醒意味着显露我们本有的、无边的清净智慧。相反,如果背道而驰,随逐外境寻找实相,只会困在自己分别念的牢笼里无法出离。
 
4.2.2混沌,碎形,复杂
 
这些仍然是遍及很多领域的现代科学名词,是科学理论发展中的重大障碍,但又与我们日常生活直接相关。近半个世纪以来,与对称性破碎类似,科学家发现许多自然现象即使可以化为单纯的数学公式,但对其行径却无法加以预测。
 
美国数学家(Stephen Smale)发现某些物体的行径经过某种规则性变化后,随后的发展并无一定的轨迹可循,呈现失序的状态。这就是所谓的“混沌”。人们熟知的蝴蝶效应就是一个典型的混沌现象。
 
混沌理论认为在混沌系统中,初始条件十分微小的变化,经过不断放大,对其未来状态会造成极其巨大的影响。这个放大用数学公式描述,其速度通常是自然指数级的(exponential)。简单来说:混沌是科学不能准确估量的现象,但它存在于最简单的现象中。
 
“碎形”一词于1975年由曼德博(B.B Mandelbrot)提出,可以说是混沌现象在空间尺度的体现。碎形指一个粗糙或零碎的几何形状可以分成数个部分,且每一部分都(至少大略)是整体缩小尺寸的形状,这一相似的性质称为自相似。
 
自然界有许多现象属于碎形,比如雪花、海岸线、山脉,乃至一片树叶或者土壤的堆积。对于研究基础粒子的物理学家来说,原子本身就是碎形的体现:原子分成原子核和电子,原子核又分成质子和中子,又分到夸克,它们之间有很大的自相似。一个简单的数学方程没办法完全表达“碎形”,然而它又是如此简单的自然现象。
 
曼德博曾于1967年在《科学》杂志上发表文章,题为《不列颠的海岸线有多长?》,这是科学家研究“碎形”的一个经典代表(Science, 155, 636)
 
你也许会惊讶,对于复杂这一现象,至今还没有统一的科学定义,因为这个现象对于科学家而言,远比混沌、碎形更加复杂。引用麻省理工学院一位理论物理学家(Michel Baranger)的描述如下:复杂系统里有很多不同的部分,它们互相依存;复杂系统有从大到小的不同尺度系统;复杂系统中混沌和非混沌并存同时发生作用;复杂系统的行为有涌现性和自组织性。
 
生物系统、人体、人类组织、社会、文化都是复杂这一现象的代表。比如人体,可分为头、四肢和躯体,再分出骨骼、肌肉、内脏、神经,又可分出不同的细胞,最后分到染色体、DNA、基因……任何一个尺度系统都不能用简单的理论表达。
 
简单的行走是一个涌现,因为它牵涉到全身;涌现行为在某种条件下,可改变或产生新的组织结构。事实上,整个自然就是在如此美妙地运作,但科学却远远落在了她的后面。人类建造出来的现代文明大都市,从自然的角度来看是多么的生硬和冷酷。
 
4.2.3微积分的缺陷
上述这些现象,虽然简单而自然,但基本上都颠覆了传统的科学概念,让我们认识到科学的理论架构有很大的缺失。这里试图从数学角度,来解释一下上述不足的原因。
 
无论经典力学或量子力学,它们的基础都是数学微积分,它们的表达形式在数学上相同,都叫二次偏微分方程。微积分的基础假设,是所研究的对象必须平滑连续。平面上一条看似很不规则的曲线,只要它是平滑连续的,都可用微分的概念,把它分成无数个小线段,每一个线段,可以用线性方程准确表达。
 
积分则是通过这些小线段,来求取相对于某条参照线而言这条曲线所覆盖的面积。这就是微积分在实际应用中的核心思想。相反,如果这条曲线不是平滑连续的,比如有很多不规整跳跃,微积分就失效了。
 
两百多年前微积分的建立,给科学家提供了强大有效的工具,来描述这个世界。它给人类社会带来了不可估量的作用,以至于人们很少去回顾连续平滑这个前提,直到混沌现象逐渐浮出水面,让科学家无法回避。
 
在微积分世界里,混沌有时被称作噪声(noise)而忽略。从另一个角度,混沌、碎形、复杂,都是无法线性化的现象,因为这些系统的本质是非线性。人体、自然界、宇宙,恰恰都是非线性系统。不应该说恰恰,而应当说,科学意欲把复杂系统线性化的想法,比较天真。这个时候我们或许可以引用米兰·昆德拉的名言:人类一思索,上帝就发笑。因为人们愈思索,真理离他越远。
 
也许你有这样的疑问:两百多年前的假设,为什么一直可以把它放在一边高枕无忧呢?物理学家不是不了解混沌,但从整个时代有限的眼光来看,微积分已经足够翻天覆地地改变人类生活,新科技层出不穷的应用甚至把人类送到月球。我们的五官已经来不及追踪时代环境的变迁,因此对于难以归约化的混沌,或许可以暂时不管。
 
正如前文所说,人们对广度研究往往要比深度研究更加重视。当我们对科学产生这样一种盲目而强大的自信后,它所带来的环境污染、生态破坏,以及臭氧洞出现,乃至种种现代心理疾病,也就不足为奇了。
 
4.3熵,热力学定律,统计力学
 
对基础理论科学做一番简单介绍后,还有必要谈一下统计力学(Statistical Mechanics)
 
理论研究和统计力学,应该说是科学研究的左右手。对于上述复杂系统,基于理论的归约化公式无能为力时,概率统计就显得很必要。从微观世界到宏观社会,都可以从基本的统计原理展开研究。统计中的一个核心概念就是“熵”,表达系统的混沌状态,或者说相反于系统已知的信息量。
 
1865年,德国物理学家克劳修斯提出熵的概念,来描述系统热量改变相对于温度的商数。这时“熵”仅限于热力学的一个状态函数,而热力学是一门建立在实验基础上,研究热、功、内能等状态函数的学科。
 
比如烧开一杯水需要多少热量?蒸汽做功的效率有多大?对于封闭系统,热力学第一定律说能量守恒,第二定律说热量只会从高温传到低温,也即系统向熵增的方向发展,第三定律说温度趋近于绝对零度时,熵会趋于零,但这个状态基本不可能达到。
 
1877年,玻尔兹曼把熵引入统计力学,用来描述一个微观体系所有可能出现的状态数。比如扔一枚硬币,朝上的只有两种可能性,正面或背面,所以扔硬币这个系统的熵值正比于ln(2)(自然对数)
 
在传统微观体系,考虑到每一个粒子在三维空间中的位置和速度,可能出现的状态数是无限的,由此也有了相空间的定义(phase space, 1901年提出),描述一个高维次(N个粒子,维次至少为N^6)的抽象空间,包含一个给定系统所有可能出现状态。因此它本质上是个高维概率空间。这个空间上存在概率流,也就是系统某个时间的可能状态,随着时间在相空间里的迁流,从状态甲迁流到状态乙等。
 
对熵的重新定义被认为是统计力学的基础,以此对系统的宏观状态展开分析,会发现热力学与统计力学是一回事。热是无序的状态,热力学在描述系统有序和无序之间的变迁。
 
明白了熵的统计学内涵,人们更加意识到,熵增原理如同射出去的时间之箭,不可阻挡地统宰着我们这个现实世界,一杯热茶自然会变凉,人自然会变老,覆水难收,聚际必散,逝者不返。在现实中没有什么能超越熵增原理。
 
熵代表混沌,也即对某个系统的未知程度。从这个角度看,概率、熵、相空间,只是人们对于这个世界的主观认知。我们只选择自己可以解读的规律,然后把自己不能跟踪的信息丢掉。特别是在数值计算中,给它取了个名词叫噪音。那么由此出发,我们对世界认知了多少呢?
 
4.3.1相空间上的刘维尔定律 (Louiville Theorem)
 
前面提到人们利用相空间来描述对于给定系统,某个时间下所有可能状态(概率密度)随着时间的迁流,刘维尔定律给出了迁流的原则,即概率密度的流动守恒。简单来说,在初始状态T0下系统有N个可能性,在相空间上是体积为V的一个集合体。换句话说,对于这个系统,我们仅了知T0时刻它一定存在于这个体积为V的集合内。
 
随着时间的推移,N个可能性会向不同的方向迁移,这个过程就像清水中的一滴墨水一样,不断扩散,直到均匀布满整个空间。结果使我们对于这个初始的系统再也无法了知,就好像原来认识的一个人逐渐隐没在茫茫人海中再也无法寻觅一样。这就是我们每时每刻所体验的熵增原理。
 
因此这个扩散的过程是一个无法追踪的混沌现象。但同时刘维尔定律又告诉我们,正如同那滴墨水,事实上这个系统并没有凭空消失或者增加,扩散到整个相空间后它的体积仍然是V,只是表面积无限增大了,超出了我们所能了知的范围。因此人们会对蝴蝶效应如此惊异,但事实就是如此。
 
由此想到了因果法则里的业力不空。不要忘记那滴墨水代表的是某个状态发生的可能性。佛陀说,当下每件事、每个念头,如果它的力量强大到可以积业,那么这个业力在久远的将来是不会空耗的,必然以不同的形式表现出来。
 
断见派或者某些禅定有限的宗派看不了前后这么久远的事,故否定了因果存在。作者个人的解读是:把当下造的业纳入那滴墨水,或者体积为V的集合体,刘维尔定律便隐射了在相空间中,这个状态将继续以不同的形式迁流下去,不会凭空消失。当然刘维尔无法跟踪每个状态的迁流轨迹,遍知的佛陀却可以。
 
4.3.2随机行走与细致平衡 (random walk & detailed balance)
 
在哲学上有决定论和非决定论。关于决定论,可以引用1814年的拉普拉斯信条(Laplace's demon)来说明:谁若知道某一刻所有的事实并对其分析,则所有控制世界的自然法则都会包含在一条公式中。对于智者来说,没有事物是含糊的,未来只会像过去般出现在他面前。当然科学发展到今天已经不会再承认这种观点,但在哲学上它仍然是决定论的一个代表。
 
叔本华是非决定论的一个代表。他曾说,大家都相信自己先天是完全自由的,甚至涵盖个人行动。但后天,从经验上,他会惊讶地发现自己并不自由,而是受制于必需品,而且尽管他有这样那样的决心,他终究无法依此改变自己的行为,而这就形成从他生命开始到结束的生活,他必须扮演自己谴责的角色。爱因斯坦说这个观点影响了他一生,使他更易于接受他人的那些令人烦恼的行为。
 
在计算机模拟中,人们通常用随机行走模拟一个粒子在格子空间(lattice space)上的轨迹,或者一条分子链在某个环境中的自然形状。简单来说可以这样解释随机行走:一个球沿一条直线运动,它只可能向前或向后,如果旁边有人投硬币,面朝上时球向前一步,面朝下时后退一步,球下一步的方向和之前的移动完全没关,即没有记忆,这就是一个随机行走的过程,在计算机模拟中发挥着很基础的作用。
 
但同时对于一个封闭的物理系统,统计学上还有一条叫做细致平衡的规律,对于两个状态,当状态A发生时前往状态B的概率PAB一定等于当B发生时前往A的概率PBAPAB的值和随机行走时的概率分布有关,即上述例子硬币正反面出现的概率。
 
在数学上可以推导随机行走和细致平衡是统一的,但光看结论,也许可以引发一些决定非决定论的思考。通常人们当下的每个决定,是结合那个时候自身和环境种种因素而考虑的,如同硬币给球的启示。对于久远的过去,没有记忆;对于遥远的未来,也没有预测。但在无始无终的时间之流中,细致平衡似乎揭示了一个上下沉浮的相似流转。当经历事件A时,与之同行的事件B也必然会在某个时间出现。
 
4.3.3熵和宇宙的起源
 
放眼浩瀚宇宙,若它作为一个孤立系统,熵值不断增大,这个世界是如何起源的?宇宙大爆炸学说于1949年提出后,不断得到实验证明,已被科学界接受。
 
1951年教皇也声称,大爆炸理论和天主教的创世概念相符合。依照大爆炸理论推算,宇宙现在的寿命约是137亿年。但在熵增原理的前提下,如果宇宙由大爆炸而来,那么最初必然有个极低的熵值。对于宇宙诞生最早期的那一刻,人们还几乎一无所知。同时人们还疑惑,既然漫长的时间以来熵值不断增大,那么为什么我们如今观察到的仍然是一个秩序井然的宇宙?
 
剑桥大学教授Roger PenroseThe Road to Reality《真实之路》,2004)猜测,这个低熵状态出现的概率是10-10^122,怎么可能出现呢?
 
一种观点认为,宇宙也许只是由于真空里能量波动而出现的,也就是从一无所有产生。这个概率似乎比大爆炸的概率更高。
 
还有观点认为宇宙总体是围绕平衡状态波动,熵值维持最大。但平衡状态中偶尔发生的波动会把系统带到一个熵值很低的状态,而人类推测的大爆炸,只是那个巨大波动所引发的瞬间现象。就像无边的大海,偶尔掀起一个巨大的浪花,大爆炸就在那个时候发生了,然后熵值开始持续增大,有了现在的我们。
 
一百多亿年过去了,这个波动仍然没有回归到平衡状态。其实,宇宙由随机波动而产生的观点,类似于19世纪麦克斯韦提出的假设。我们自身,以及我们所观察到的有序世界,都只不过是混沌的宇宙一次随机波动的结果。这一命题被称为麦克斯韦大脑。
 
当然,研究宇宙起源的科学家还有一个最关键的人择原则:我们观察到不可能存在宇宙,因为我们人类早已存在于这个世界了(We observe this very unlikely universe because the unlikely conditions are necessary for us to be hereWikipedia)
 
故而,既然我们存在,那么概率再小的事件也已然发生了。想象一下宇宙无边无际,时间也漫漫无尽,这个概率相对于我们基本上为零,但也许相对于宇宙还是可能实现的。似乎爱因斯坦过去也提起过,他说你恰好出生在这个时代而不是新石器时代或者古罗马时代的概率不需要去关心,因为你已经出生了。
 
上述观点,一方面表现了目前科学家对于人类自身存在的迷惑不解;另一方面,假设这些推断趋近于事实,回顾佛陀所说的人身暇满难得,如盲龟值轭,也许我们可以用科学家的勇气,想象一下人身难得的概率。
 
盲龟所在的海洋大如三千大千世界。一百年浮出水面一次的盲龟,恰好头伸入漂浮在海上的木轭孔的概率,远远比大爆炸低。佛陀是实语者,不会用一个夸张的例子来描述暇满,但是实际的可能性,远远小于我们分别念所能计算的概率,故只好用比喻说明。也正如科学家们所说,概率确实趋近于零,然而人类确实存活在这个星球上了。故而我们既然已经身为人,确实应该思维一下生命的何去何从。
 
5.结语
 
本文试图论述前后世的存在,却把重点放在了科学所面临的局限上。因为作者猜测同我一般的大众,若要认真思索和建立世界观,也许需要一定的科学来辅助探讨,毕竟从小到大,科学与我们的生活息息相关。
 
当然,依照佛陀的智慧,我们无需探索深广的宇宙,只观察当下这个念头的生灭,就足以洞察万法。比如宗萨仁波切在巴西宣讲入行论时,有人曾问这个世界怎么运作,人类是如何进化或发展的。仁波切反问了三个问题作为回答:
 
你看到的杯子和我看到的杯子是一个么?
在你不认识我之前,对你而言我存在么?
客体先于主体产生么?
 
很可惜,在科学知识的训练中,思维已经习惯了在外境中寻找二元对立,总有一个很自信的常识,在比较大小、长短、好坏、真假、美丑,等等。
 
但这完全不是指责或者嘲讽科学家的迷失。他们的勤奋、严谨、热情,以及坚持不懈的投入,具有颠覆精神的大胆猜想,并付诸行动,绝对值得任何人敬仰。在探索真理面前,无论宗教徒或非宗教徒,也许都需要这种勇于面对的大无畏精神吧。
 
作为结尾,权且再次引用昆德拉的话以自警、共勉。
 
人类一思索,上帝就发笑,
因为人们愈思索,真理离他越远。
因为人们从来就跟他想象中的自己不一样。
 
思考从来就不是阻碍自己进步的原因,
思考的目的在于找出自身的弱点并实践改进,
想太多而不做,或是不想而假装接受,
这才是上帝发笑的原因。
 
因为这种思考,
叫做自己骗自己。
 
6.回向致谢
 
但愿以此文之缘,作者和读者都能重新审视自己,所持的见地是否与真理相合,并扎根于心田坚不可摧。但愿轮回和因果的真理,渗透在每个人的心念中,成为行为取舍的智慧。但愿我们对未来无有恐惧和妄想,一心安住于证悟之道!
 
祈愿所有的众生都能圆满证悟佛陀般的智慧,获得最究竟的解脱。祈愿佛法智慧明灯永久住世,遣除众生的无边黑暗。
 


This Blog

Linked From Here

The Web

This Blog
 
 
 
 
Linked From Here
 
 
 
The Web
 
 
 

February 6, 2010


[读书笔记] 人工智能中的不确定知识与推理 PART 1:概率推理

BOOK:Stuart Russell, Peter Norvig, Artifical Intelligence: A Modern Approach(中译第二版,姜哲等), Pearson


不确定性的研究来源于一个不幸的事实:智能体几乎从来无法了解关于其环境的全部事实, 因此对其行动的可行程度构造一个完备而正确的描述是几乎不可能的。书中概括规则不确定性的来源为三个方面:1)惰性,对所有相关规则的一一罗列着实过于繁杂;2)理论的无知,现代科学在大多数领域都无法掌握完备的规则;3)实践的无知,即使掌握所有规则,我们也无法对其一一验证。
题外话:书中第一章绪论提到一种观点“要解决一个难题,你必须已经差不多知道答案”,这里的解决指的是AI方法的解决,直白地说,人类无法通过人工智能来解决连自己都找不到头绪的问题。这种观点缠绕着AI由古至今,数学的上限决定了AI发展的上限,学者们能做的只是不断逼近却无法超越(也许),这是哲学与数学产生的基础所决定的可悲事实。
因此,我们只能期待智能体在给定所拥有的环境信息下,在可以执行的规划中选择性能度量达到最大的一个,即理性决策(期望效用最大化)。理性决策是概率理论和效用理论的结合,前者提供一种方法以概括不确定性,后者对智能体的偏好进行表示和推理使其选择能产生最高期望效用的行动。
那么,作为一种合格的不确定性推理模型,首先要合理地表示各种不确定的规则,而后对于给定的观察事实(证据)能够给出各种规划的效用分布情况,最后针对效用分布作出理性决策。这样的推理模型有很多,其中一种最基础也是已经得到成熟发展的不确定知识表示方法,就是贝叶斯网络。
  • 朴素贝叶斯模型Naive Bayesian Model
    这来源于概率论中著名的贝叶斯法则Bayes' Rule:P(a|b) = P(b|a)·P(b) / P(a)(书中有句话说,这个简单的公式是几乎所有概率推理的现代人工智能系统的基础,在此表示同意)。通过合并条件的方式,我们得到如下的概率分布,即朴素贝叶斯模型(Cause指原因,Effect指各种受其影响的结果):
              clause111
    NBM的成立以条件的独立性假设为前提,也就是说,每一个Effect变量取值都由Cause导致,但是它们彼此之间没有直接影响。条件独立断言对全联合概率分布作了理想式的简化,使得概率系统能够进行规模扩展(将一张大的概率表分割成很多小的概率表来处理,复杂度由O(2^n) 降至O(n) )。并且,其相较绝对独立性断言更加普遍容易获得。虽然条件独立性假设在大多数情况下都不成立,但是NBM比纯粹的逻辑智能体要好得多。
     
  • 贝叶斯网络Bayesian Network贝叶斯网络为任意的全联合概率分布提供了一种简便的规范,它是一个有向无环图,每个节点都标注了定量概率信息,用于表示变量之间的依赖关系。如下图所示,箭头由父节点指向子节点,节点Xi 有一个条件概率分布P(Xi | Parent(Xi)) 量化父节点对其的影响,没有连线的变量间相互独立。BN是一种局部结构化系统,具有紧致性,假设系统有n个随机布尔变量,每个变量受到至多k个其他随机变量的影响,那么整个BN可以由不超过n·2^k个数据完全描述,而全联合概率分布则需要2^n个。
             graph122
    BN节点的正确添加次序是:首先添加“根本原因”节点,然后加入受它们影响的变量,直到叶子;错误的添加次序将带来糟糕的网络和额外不必要的需指定的数据,但是尽管如此,它们都表示完全相同的全联合概率分布。
    全联合概率分布中的每个条目都可以通过BN的信息计算出来,有公式
             clause210
    这是BN的数值语义,另外还有与之等价的拓扑语义,其有两种描述,指出图中条件独立的节点:1) 给定父节点,一个节点与它的非后代节点是条件独立的;2) 给定一个节点的父节点、子节点以及子节点的父节点,那么这个节点与网络中的其他节点是条件独立的(又称马尔可夫覆盖Markov Blanket,第一次正式在教科书中与Markov 碰面,幸会幸会~)。
    另,混合贝叶斯网络Hybrid Bayesian Network,指的是同时包含离散随机变量和连续随机变量(比如,概率是高斯分布的)的网络。
     
  • 基于贝叶斯网络的概率推理对于任意一种概率推理系统,其最基本的任务是:在给定某些证据(如诸多Effect )后,计算一组查询变量(如Cause )的后验概率分布。

    1)精确推理。
    既然贝叶斯网络给出了全联合概率分布的完备表示,那么查询P(X | e) 就根据网络写成条件概率乘积的形式,然后通过枚举网络中的所有变量并把条件概率表中的对应条目乘起来后求和的方式来回答查询(Enumeraton-Ask)。对X的每一取值x,其计算过程可以用一棵树来表达,如下图左。算法对这棵树作深度优先递归,对每条路径求积,在分支节点处求和,不断递归得到x的后验概率。
           graph2_thumb23           graph3_thumb3
    这种算法是对全联合查询的简单修改,其对全联合分布求和但不显式地构造它。可以看到,它重复计算了很多子表达式,对于一个有n个布尔变量的网络,时间复杂度始终都是O(2^n)。
    那么很自然地,我们能想到对这些子式只进行一次计算,并保存计算结果以备将来使用,来降低时间复杂度。典型地,有变量消元算法(Variable Elimination)。算法在查询求值之前,先剪除所有即非查询变量亦非证据变量祖先的节点,然后从右到左计算表达式。表达式中的所有计算因子都用概率分布来表达,因其变量个数有些写作二元向量,有些写作矩阵。因子间的相乘,以概率分布的点积来代替,使得所有的中间结果被保留下来。这种点积不是矩阵乘法,而是两个具有同一些因子的概率分布的消元联合,如f1(A, B)·f2(B, C) = f3(A, B, C),若有f1(T, T) = 0.3,f2(T, F) = 0.6,那么就有f3(T, T, F) = 0.18。最后,通过不断的消元点积,得到查询所需的分布。
    变量消元算法的时间和空间需求取决于算法运行过程中构造的最大因子,而后者又进一步取决于变量消元次序和网络结构。对于单连通的网络(如上图左),其与网络复杂度成线性关系;但对于多连通的网络(如上图右),书中称这种情况下将有指数级的时间和空间复杂度,并其与计算逻辑命题的布尔满足赋值个数问题难度相当(归约方法证明),是一个#P问题,严格地难于NPC问题。团算法(Clustering)可将这种图中的单独节点联合,形成团节点,最终使得网络结构是一个单连通图,但这种构造也是NPC的(计算理论无处不在XD)。

    2)近似推理。
    由于大规模多连通网络中的精确推理是不可操作的,就有必要考虑近似的推理方法。
    最Naive的,我们通过直接采样的方法,按照拓扑次序依次对每个变量进行采样,被采样变量值的概率分布依赖于其父节点的赋值,再按概率随机对其赋值,多次重复得到大量样本后,就可以计算查询在样本集中的概率分布。显然,此概率分布在极限情况下能过收敛到查询的真实值,且准确度与采样个数有关。直接采样方法有两种衍生算法,用于计算条件概率:拒绝采样(Rejection Sampling),直接采样后剔除证据与查询不同的样本,再归一化概率分布;似然加权(Likelyhood Weighting),这种方法只生成与证据一致的样本,但在生成样本的过程中计算似然权值w补偿真实采样分布与期望采样分布之间的差距,w是每个证据变量在给定其父节点条件下的取值概率的乘积。容易察觉到,前者的可用样本总是很少因此效率低下,而后者的效率虽然较前者要高,但当证据变量个数增加时,大多数样本的权值都将变得非常低,性能将大受影响。
    比较普适地,近似推理有三族主流的方法,分别为变分近似(Variational Approximation)、信度传播(Belief Propagation)以及马尔可夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)方法。
    MCMC方法:通过对前一个样本进行随机改变而生成下一个样本,在每一步采样循环中,对某个非证据变量Xi 进行采样,其转移方向取决于Xi 的马尔可夫覆盖中变量的当前值。MCMC方法认为采样过程最终会进入一种“动态平衡”,处于这样的情况下,长期来看在每个状态上花费的时间都与其后验概率成正比,也就是稳态分布(Stationary Distribution):
             clause3_thumb11
    其中,π(x) 为状态x的概率,q(x'→x)为状态x转移到x'的概率。
    有性质称为细致平衡(Detailed Balance),意味着任何两种状态之间的期望流量相等:
            clause4_thumb7
    吉布斯采样器(Gibbs Sample)是MCMC方法的一个简单变体,容易证明其满足与真实厚颜概率一致的细致平衡。
    变分近似方法:其基本思想是提出一个原问题的易于处理的简化版本,并通过调整变分参数,使简化问题与原问题之间的距离函数最小化,以保证其与原问题尽可能地相似。
    信度传播方法:又称环传播(Loop Propagation),由Judea Pearl在1982年提出,现被应用于超大规模和非常高连通度的贝叶斯网络,是一种以局部的信度传递代替全局积分的算法,虽然有时会不正确或不收敛,但在绝大多数情况下其结果与真实值是非常接近的。
     
  • 不确定推理的其它方法
    缺省推理(Default Reasoning):它不是把结论当作“在某种程度上相信”,而是“相信,除非找到相信其它事物的更好理由”。在这种体系下,推理总是选择相信缺省值,除非出现某种更特定的值,将缺省值覆盖,如我们相信“张三有两条腿”,除非有信息“张三只有一条腿”。
    基于规则(Rule-Based):这种方法建立在基于规则的逻辑系统之上,对每条规则增加某种“伪因子”以容纳不确定性,曾被广泛应用于专家系统。但由于其无法很好地适应规则集的膨胀和新规则的不断加入,这种方法现在已不被推荐使用。
    无知问题Dempster-Shafer理论:这一理论的存在是为了处理不确定性与无知性的区别,它使用区间值信度来表示智能体对命题概率的知识,允许我们通过信度的变化程度对“无知性”进行表达。比如抛硬币的问题,当硬币均匀时,我们知道正反面出现的概率各为0.5,但是我们对硬币是否均匀却是无知的,此时,该理论认为正反面出现的概率均为[0, 1],那么如果有专家作出检测硬币是均匀的概率是0.9,那么该理论认为,正反面出现的概率就均为[0.45, 0.55]。
    模糊集与模糊逻辑:模糊集理论对命题的定义十分接近自然语言,模糊谓词的真值是介于0和1之间的一个数值,这就意味着,模糊集是一个没有清晰边界的集合,比如我们描述一个人是否高,这就可以用模糊集理论来表述。模糊集理论和基于其的模糊逻辑通常被应用于构造控制系统,但是它和基于规则的推理方法一样,都具有真值函数性,这是说,复合语句的真值通过其各组成部分的真值来计算。而除非存在非常强的独立性假设,这种概率组合是行不通的。这使得模糊集理论在处理复杂网络的问题上,将带来灾难性的不正确信度。

No comments:

Post a Comment