怎样理解“DNA是生命的蓝图”这句话? (一) 精选
科学时报 (博客)-May 13, 2015
在前体分子被切成两段时,羧基段把一个胆固醇分子加到氨基段的羧基端上,这个被加上胆固醇的氨基端部分随后被分泌到细胞外,作为信号分子, ...
人造病毒突破基因治疗瓶颈
生物通-Apr 9, 2015
在化学方面,关键在于,分别位于模块化蛋白质氨基和羧基端的阳离子肽和六局组氨酸相结合。 UAB研究人员已经证明,当存在DNA时,这些人造 ...
清华大学颜宁教授Cell Res发表新研究成果
生物通-Mar 15, 2015
哺乳动物和裂殖酵母的SCAP蛋白都是由包含8个跨膜螺旋(TM)的氨基末端结构域和羧基(C)端WD40结构域构成。SCAP是通过胞质WD40结构域 ...
高三生物知识点进行总结
搜狐-Feb 25, 2015
氨基酸在结构上的特点:每种氨基酸分子至少含有一个氨基(-NH2)和一个羧基(-COOH),并且都有一个氨基和一个羧基连接在同一个碳原子上(如: ...
怎样理解“DNA是生命的蓝图”这句话? (一) 精选
钙粘蛋白(cadherin)让细胞分类聚集
细胞的极化是形成面、片、腔、管的基础
形成和维持细胞极性的原理
形成和维持细胞极性的蛋白质
(1)Par复合物
(2)Crumbs复合物
(3)Scribble 复合物
(4)细胞膜成分的不对称分布
让上皮里面的细胞在平面上也有方向性——促成“平面细胞极性”的基因
使相邻的细胞有不同命运的蛋白质——Notch和它的底物分子
小结
Wnt基因和信号通路
“刺猬蛋白”(Hedgehog protein)
和Wnt蛋白、刺猬蛋白Hh一样,FGF蛋白也是细胞分泌到细胞外的信号分子,通过结合到细胞表面的受体分子上起作用。和上面几种蛋白不同的是,FGF蛋白除了与受体蛋白结合外,还结合细胞表面“硫酸乙酰肝素”(Heparansulfate,简称HS,是一种与肝素类似的多糖分子),因此对细胞膜也有一定的亲和力。
FGF的受体(FGFR)有四种,都是含有单个跨膜区段的膜蛋白。其中细胞外的区段负责与FGF分子结合,同时协助FGF分子与硫酸乙酰肝素分子结合。受体细胞内的区段具有酪氨酸蛋白激酶的活性,可以使细胞内的下游分子磷酸化,把信号传递下去。每种受体可以与一组特定的FGF分子结合,多数FGF分子也可以和几种受体分子结合,但是要传递信号,必须是两个相同的FGF分子与两个相同的受体分子结合,形成四聚体。四聚体的形成使受体的酪氨酸激酶的活性被激活,再通过下游分子的磷酸化把信息传递下去。
与多数生长因子受体一样,FGFR都是酪氨酸激酶型受体。酪氨酸激酶能够使蛋白分子中的酪氨酸残基被磷酸化,改变蛋白的性质。其中一些被磷酸化的蛋白本身也是酪氨酸激酶,又能够使更下游的蛋白质磷酸化,是动物细胞中传递信息的重要方式。例如FGFR在与FGF结合而被活化后,就能够活化磷脂酶-g(Plcg),生成“磷脂酰肌醇-3,4,5-三磷酸” PIP3,并且通过蛋白激酶C(PKC)、c-Jun氨基末端激酶(c-Jun N-terminal kinase, 简称JNK)、丝裂原活化蛋白激酶(mitogen-activated proteinkinase,简称MAPK)、细胞外调节蛋白激酶(extracellular regulated protein kinases,简称ERK)等多条途径影响基因表达。
骨形态发生蛋白BMP
1965年,美国的整形外科专家Marshall R.Urist发现,用酸除去骨里面的钙质,再植入兔的体内,可以诱导新骨的生成,他把里面负责诱导骨生成的因子叫做“骨形态发生蛋白”(Bone Morphogenic Protein,简称BMP)。随后的研究发现,BMP是“转化生长因子-b”(Transforming growth factor-b,简称TGF-b)超级家族的成员,是一种非常重要的形态发生蛋白,在身体各部分结构的形成中起不可缺少的作用。
BMP在细胞中也先是合成其前体蛋白,随后羧基端100-125氨基酸的部分被水解出来,形成二聚体,被分泌到细胞外作为诱导信号分子,所以BMP和Wnt蛋白、刺猬蛋白(如Shh)和FGF蛋白类似,也是通过在细胞外移动来传达信息的分子。BMP可以使间充质细胞变成骨细胞和软骨细胞,在动物肢体形成上起关键作用(见此文的第二部分,《我们的五根手指头是如何长出来的?》)。它也可以使“生肾芽基”中的间充质细胞发生间充质细胞-上皮细胞的转化,这样形成的上皮细胞后来形成肾小球和肾小管,并且通过抑制肾脏中上皮细胞-间充质细胞的转化,维持肾脏结构的稳定性。在斑马鱼(zebra fish)中,BMP的表达促使腹面结构的形成,而它在背面的活性被抑制,导致背面结构的形成,所以BMP在背-腹轴的形成中起关键作用。如果让所有细胞都表达BMP,那就只有腹面结构能够形成;如果用截短的BMP来对抗全长BMP的作用,斑马鱼就只形成背面结构。这些事实都表明BMP蛋白在生物体结构形成中的重要作用。
细胞表面有两类BMP受体分子,类型I和类型II。它们除了能够和BMP蛋白结合外,还有丝氨酸/苏氨酸蛋白激酶的活性,能够在其他蛋白分子中的丝氨酸或苏氨酸残基上加上磷酸基团。由于BMP分子形成二聚体,和它结合的受体也是二聚体。类型I和类型II受体和BMP的结合会导致两类受体形成四聚体(包含两个I型受体和两个II型受体)。II型受体会使四聚体中的I型受体磷酸化,使I型受体活化。活化的I型受体又会使细胞内的下游分子磷酸化,活化这些分子,使信号传递下去。
细胞内传递BMP信号的分子叫做SMAD,由果蝇中MAD(mother against decapentaplegic)和线虫中同源分子SMA(small body size)两个名称合并而成。SMAD蛋白分为三类。一类是从BMP受体处接收信号的,叫做R-SMAD(其中的R表示Receptor),包括SMAD1、SMAD2、SMAD3、SMAD5和SMAD8/9。第二类是起协助作用的,叫做co-SMAD(其中co表示common-mediator),只有SMAD4一种。第三类是起抑制作用的,叫做I-SMAD(其中I表示inhibitory),包括SMAD6和SMAD7。它们能够抑制前两类SMAD蛋白的作用。在BMP结合到I和II型受体上,活化类型I受体时,R-SMAD中的SMAD1和SMAD5被磷酸化而被活化。活化的SMAD1和SMAD5再和SMAD4形成三聚物,在细胞核中起转录因子的作用,调控基因表达。
控制左右不对称的蛋白——Lefty和Nodal
动物的身体分为左右两半,而且是不完全对称的。例如人的心脏位于身体的左边,肝脏位于右边。肺脏虽然胸腔的左右两边都有,但是肺叶数也不同(右边三叶,左边两叶)。控制动物身体左右不同发育的分子被认为也是被分泌的信号分子,但是在长时期中具体的分子一直没有被确定。
1996年,日本科学家滨田宏(Hiroshi Hamada)的实验室发现了小鼠胚胎中决定左右的分子,它在原肠胚形成过程中只位于胚胎的左边,因而被命名为Lefty。同BMP蛋白一样,Lefty蛋白也是“转化生长因子-b”(TGF-b)超级家族的成员,而且也是先被合成为前体分子,被蛋白酶加工切短以后再被分泌到细胞外,成为可扩散的信号分子。
Lefty的主要功能是对抗另一个扩散蛋白——Nodal的功能。Nodal也是“转化生长因子-b”(TGF-b)超级家族的成员,而且也是先被合成为前体分子。与Lefty不同的是,Nodal前体分子是在被分泌到细胞之外以后,才被一个叫做“转换酶”(Convertase)的蛋白酶切短,成为成熟的信号分子的。在动物的胚胎早期发育中,Nodal信号对于内胚层(endoderm)和中胚层(mesoderm)的形成,以及随后身体左右轴的形成都起重要作用。Lefty的合成需要Nodal蛋白的合成,Lefty蛋白又反过来抑制Nodal的活性,组成一个负反馈系统。
Nodal蛋白质与细胞上的受体结合,这些受体具有丝氨酸/苏氨酸激酶活性,可以使下游的蛋白信号分子被磷酸化。同BMP蛋白类似,Nodal的下游分子也是Smad蛋白。不过BMP磷酸化的是Smad1和Smad5,被磷酸化的Smad1和Smad5再和Smad4结合,进入细胞核调节基因表达;而Nodal受体分子磷酸化的是Smad2和Smad3,被磷酸化的Smad2和Smad3再和Smad4结合,进入细胞核,在那里它们再分别与p53、Mixer、FoxH1等蛋白质结合,与不同的基因启动子相互作用,调控这些基因的表达。 虽然Nodal和BMP都属于“转化生长因子-b”(TGF-b)家族的成员,下游的分子也都是Smad蛋白,但是它们的功能有所区别。BMP3和BMP7还能和细胞外的Nodal蛋白结合,彼此抑制对方的功能。
视黄酸RA
在控制动物结构形成的分泌分子中,视黄酸(Retinoic acid,简称RA)是一种非蛋白分子,从节索动物到脊椎动物,都需要它的诱导来形成身体中组织和器官。在动物早期的胚胎发育中,从身体特定区域分泌的RA能够在细胞和组织中扩散,形成RA的浓度梯度,使细胞能够根据这个梯度来获知自己在动物体内的位置,决定身体前后轴方向的结构形成。
RA由维生素A(即视黄醇retinol)经过两步氧化而成。第一步由RA脱氢酶催化,形成视黄醛(retinaldehyde),这是视网膜中感知光线的分子。视黄醛再经视黄醛脱氢酶催化,形成视黄酸RA。 RA是水溶性分子,能够比较自由地在细胞之间扩散,并且能够进入细胞,所以RA的受体不在细胞表面上,而是在细胞质中。RA的受体叫RAR,在结合RA后,RAR再和RXR(retinoid X receptor)结合,形成二聚体。这个RAR/RXR二聚体能够结合到DNA分子上的“RA反应序列”上,影响基因的表达。
小结
Wnt 蛋白、刺猬蛋白Hedgehog及其在哺乳动物中的同源蛋白音刺猬蛋白Shh、成纤维细胞生长因子FGF、骨形态蛋白BMP、以及非蛋白分子的视黄酸RA,都是由细胞分泌到细胞外,通过扩散影响其它细胞命运的的分子。它们和细胞上或细胞内的受体结合,触发信号传递链,最后在细胞核中影响细胞基因表达的状况,改变细胞的命运,即改变细胞的类型。细胞改变类型后,极性和表面蛋白的表达和分布状态也会改变,从而形成各种空间结构。这些扩散分子并不直接控制结构的形成,而是通过改变细胞的类型,让新形成的细胞“自行”组织成各种结构。
靠扩散来影响其它细胞的命运的分子,可以在远距离(即多个细胞的距离)上决定细胞的命运,从而在器官的尺寸水平上形成各种组织和结构。但是在形成各种器官时,还需要具体负责“建造工程”的基因。例如果蝇的身体外部就有口器、眼、触角、腿、翅膀等结构,要靠扩散分子来直接控制这些结构的形成,“线条”还太“粗”。这就像城市管理机构可以决定在哪里修建机场,在哪里建购物中心,在哪里建公园,但是具体建造这些场所还需要具体的“专业户”。他们各司其责,建机场的不负责建购物中心,建购物中心的不管建公园。在果蝇身体中,就有这样的“专业户”,有的负责触角的生成,有的复杂眼睛的生成,有的负责腿的生成。它们从扩散分子接到指令,动员下游的有关基因,具体去完成各种结构的建造。
这样的“专业户基因”有多种,其中一种就是“同源异形基因”(homeotic gene)。在这里homeotic的意思是如果这种基因发生突变,原先负责建造的结构就会变成另外一种结构,例如pb基因的突变会使原来应该长口器的地方长出腿来。另外一种叫做“Paired Box基因”,简称Pax基因,是与同源异形基因关系密切的基因。它们在生物结构中也起重要作用,例如Pax3的突变会造成耳聋,Pax6的突变会使眼睛不能正常形成,Pax2基因突变影响肾脏的正常形成等。
果蝇的Hox基因 同源异形基因也是发现“刺猬蛋白”(Hedgehog protein)的德国科学家Christiane Nüsslein-Volhard和EricWieschaus用突变剂“乙基甲磺酸脂”(EMS)对果蝇进行“饱和突变”时发现的。随后,美国科学家Edward B. Lewis具体研究了这些基因在果蝇胚胎发育中的作用,即发现了果蝇中具体实现结构形成的“专业户”。
对这些基因的研究发现,这些基因的蛋白产物都是转录因子,而不再是分泌到细胞外,通过在细胞之间扩散来发挥作用的分子。它们位于细胞内,管理为形成某个结构所需要的全部基因。例如果蝇的Antennapedia基因(简称Antp基因)是负责“包工”果蝇腿的形成的,这个基因的蛋白产物就可以调动为腿的形成所需要的全部基因。只要这个基因被表达,在表达基因的地方就会长出腿来,而不管是在身体的什么地方。例如果蝇头部的Antp基因被活化,在原来该长触角的地方就会长出腿来。所以这些基因相当于是“包工队”的“队长”,它根据自己的任务动员所需要的人员和设备来完成特定的建造工作。 这些“包工队”的“队长”也不是只做一种工作,这就要看在具体的生物中下游基因是什么。例如Ubx基因在果蝇中是控制平衡杆(Halteres)的生成,而在蝴蝶中是控制后翅的形成。这就像包工队的队长不是只会盖一种楼,而是可以盖彼此有相似性的楼一样。
这些基因还可以相互作用,例如Ubx基因的产物就可以结合在Antp基因的启动子上,抑制Antp基因的表达。在Ubx基因被活化的地方,Antp基因就不能起作用。这样,就不会出现数个专业户因为争夺工程而互相“打架”的情形。
果蝇的同源异形基因都位于第3染色体上,分为两群,分别是“双胸复合群”(Bithorax comlex,简称BX-C),和“触角复合群”(Antennapedia Complex,简称ANT-C),这两个homeotic基因群统称HOM-C。 对这些基因的DNA序列分析发现,每个基因都含有一个高度保守的,由180个碱基对组成的区段,为60个氨基酸编码。由这些氨基酸组成的肽链段负责和下游基因调控部位的DNA序列结合,而且各种同源异形基因的这段DNA序列高度相似,被统称为“同源异形盒”(Homeobox),这些基因也就在英文中被称为Homeobox基因,简称Hox基因。
既然不同的Hox基因的同源异形盒都高度相似,下游基因又如何区分这些基因,从而决定哪些Hox基因管控哪些下游基因呢?这就是盒子中第9位的氨基酸的作用。所有的同源异形盒都能够结合到下游基因调控部位的TAAT序列上,但是区分不同盒子的是DNA序列在这个TAAT序列旁边的核苷酸。例如果蝇的Antp基因的盒子在第9位上的氨基酸是“谷氨酰胺”,结合到TAAT序列旁边的腺嘌呤(A)上。而果蝇的Bicoid蛋白中,第9位的氨基酸是赖氨酸,结合到TAAT序列旁边的鸟便嘌呤(G)上。如果把Bicoid蛋白中的赖氨酸换成谷氨酰胺,它就会结合到Antp控制的基因上。通过这种方式,不同的Hox基因就可以特异地控制自己的下游基因,它们的作用就不会彼此混淆了。
Hox基因在果蝇第3号染色体上的排列方式也很有趣,即它们在染色体中的排列顺序和它们在果蝇身体上表达部位的空间顺序一致。位于DNA 3’端的Hox基因表达在果蝇身体的头部,而位于DNA 5’ 端的Hox基因表达在果蝇身体的尾部,位于这两端之间的Hox基因也按照它们在DNA中的顺序在身体中依次排列,这个现象叫做“同线性”(Co-linearity)。为何Hox基因在DNA上排列的顺序和它们在身体中表达的空间顺序相同,一直是使发育生物学家感到困惑的问题。控制性别的基因中,位于上游和下游的基因在DNA上就不按什么顺序排列,甚至可以不在同一条染色体上。Hox基因的同线性也许是这些基因需要排列在一起,以受一些共同的机制调控。
哺乳动物的Hox基因
由于180个碱基对的DNA序列(同源异形盒)在Hox基因中是高度保守的,用这部分DNA序列来和哺乳动物的DNA杂交,就可以找出哺乳动物中类似的基因。用这种方法,科学家在哺乳动物如小鼠(mouse)和人身上也发现了Hox基因。如果把果蝇的“双胸复合群”和“触角复合群”(称HOM-C)总共算做一组,那么哺乳动物中就有四组,分别叫做A、B、C、D,每一组里面有13个Hox基因的位置,其中一些和果蝇HOM-C中的Hox基因对应,因此哺乳动物有四套Hox基因。这四组Hox基因位于不同的染色体上,例如在小鼠中,它们分别位于第6、11、15、2号染色体上,在人体中这四组Hox基因则分别位于第7、17、12、2号染色体上。人类的Hox基因全用大写英文字母,例如HOXB1表示B组Hox基因中的第1号基因。小鼠的Hox基因则只第一个字母大写,例如Hoxa10表示小鼠a组Hox基因中的第10个。
如果把果蝇HOM-C中Hox基因的排列顺序和哺乳动物每组中Hox基因的排列顺序相比较,就会发现对应基因的排列顺序是一致的,即在进化过程中保留不变。例如果蝇中 Dfd-Scr-Antp-Ubx-abdA-abdB 的排列顺序,就和人对应的 HoxB4-HoxB5-HoxB6-HoxB7-HoxB8-HoxB9 基因的排列顺序一致。其中人的HOXB4就相当于果蝇的Dfd,人的HOXB7就相当于果蝇的Ubx,等等。不同组中号码相同的Hox基因功能相似,叫做“平行同源家族”(paralogs)。例如小鼠的Hoxa3、Hoxb3、Hoxd3都和颈部脊椎骨的形成有关。多个平行同源家族的基因由于功能相似,相当于具有备份,这样一个基因的突变就不容易造成重大的恶果。例如Hoxa11和Hoxd11都和手臂中的桡骨(radius)和尺骨(ulna)的形成有关。突变Hoxa11基因或者突变Hoxd11基因都只能对桡骨和尺骨的形成造成轻微缺陷,只有这两个基因同时突变才会使桡骨和尺骨无法形成。不同动物中同号的基因功能也相似。例如鸡的Hox基因就能取代果蝇的对应基因。但是同组中相邻的Hox基因功能却彼此不同。例如Hoxa11的功能就不能由Hoxa3基因取代。
在哺乳动物中,身体的发展和调节更为复杂,Hox基因不仅在胚胎发育中起作用,也在成年动物身上起作用,例如在血细胞的分化上,这就和Hox基因在结构上的作用无关了。反过来,身体里面一些结构的发育也不完全由Hox基因控制。例如在动物眼睛的发育中,Pax6 基因就起关键作用,敲除小鼠的Pax6基因,眼睛就不能形成。而且Pax6基因的作用是高度保守的,小鼠的Pax6基因甚至能够在果蝇中诱导眼睛的生成。所以在前面我们说Hox基因是“包工队”的“队长”,只是一个简化的比喻,Hox基因的工作方式是非常复杂的。
许多Hox基因受上游基因的控制,特别是我们前面讲到的成纤维细胞生长因子FGF和视黄酸RA。它们位于发育中的胚胎的两端,分别控制一些Hox基因。FGF主要控制DNA上5’端(对应于动物的尾端)的Hox基因,而DNA上3’端(对应于动物首端)的Hox基因主要为RA所控制。
水螅和酵母就有Hox基因
科学家在果蝇中发现Hox基因后,人们一度以为Hox基因只存在于两侧对称生物中(bilaterals),因为这些生物才有前后轴和背腹轴。然而在刺细胞动物(Cnidaria)如水螅(Hydra)中,科学家也克隆到了5个Hox基因,并且测定了其中两个的DNA序列(分别叫做Cnox-2和Cnox-3)。虽然水螅的身体像一根空管,是辐射对称的,Hox基因在水螅中被发现说明Hox基因很早就开始扮演结构形成的角色。Cnox-3主要集中在水螅身体的上1/8部分,在身体和触角的交界处,也在出芽水螅的顶端。如果水螅从中间切断,下半截朝上的部分(即原来的嘴的方向,也可以看出水螅的“头”的方向)就会表达比较高的Cnox-3,促使水螅长出新的“头”。而Cnox-2主要表达在身体的其余部分,而在水螅身体的上1/8部分很少表达,所以Cnox-2的作用可能是抑制“头”的生成。
从Cnox-2和Cnox-3蛋白的氨基酸序列来看,它们分别类似于小鼠的Hox-4和Hox-1,都是表达在靠身体靠前部的基因。如果把水螅的“头部”看成“前端”,而Cnox-3的表达位置比Cnox-2更靠前端,这说明水螅的Hox基因就已经根据身体的前后位置来表达了。也就是说,在两侧对称动物出现之前,Hox基因就已经在动物身体的发育上起作用了。这些事实说明,Hox基因组也许最先是由一个Hox基因经过复制然后分化形成的,而在哺乳动物中又整组Hox基因被复制。
Hox基因的出现甚至可以追溯到水螅之前,例如Hox基因在单细胞的裂殖酵母(Schizosaccharomycespombe)中就已经有了。它含有一个同源异形盒,被称为“裂殖酵母的Hox基因”(Pombe Homeobox),简称Phx1基因,说明Hox基因有非常久远的历史。目前测到的Phx1基因的功能是增加丙酮酸脱羧酶的合成,把原来用于三羧酸循环原料的丙酮酸变成乙醛,再变为乙醇,即对有机分子进行无氧代谢,增强酵母菌在生长停滞期和营养缺乏时生存的能力。Phx1是如何在多细胞动物中变为控制结构形成的基因的,或者哪一个单细胞生物的Hox基因后来演变为动物的Hox基因,是一个有趣的问题。
Pax基因家族
除了Hox基因,另一组基因,叫做Pax基因的,也在动物身体的结构形成上起重要的作用。它们含有部分的或者整个的同源异形盒(Homeobox),因此和Hox基因家族关系密切,可以看成是Hox基因的“亲戚”。和Hox相同的是,Pax基因也是转录因子,通过结合在基因的调控序列上影响基因的表达。和Hox基因不同的是,Hox蛋白只有一个DNA结合区段(即同源异形盒),而Pax蛋白有两个DNA结合区段,一个是同源异形盒,叫“同源异形区段”(Homeodomain,简称HD)。另一个叫“配对区段”(Paired domain,简称PD)。由于这些基因的产物有两个(成对的)DNA结合区段,这些基因也因此叫做“成对区段基因”(Paired Box)基因,简称Pax基因。Pax基因用这两个DNA结合区段分别执行不同的任务。例如Pax6蛋白用HD来控制眼睛的发育(包括晶状体和视网膜),而用PD来控制神经系统的发育。
像Hox基因家族一样,Pax基因家族也有多个成员,分别执行不同的功能。
在小鼠中,Pax1基因控制脊柱的发育和身体分为节段。估计在人体中也有类似功能。Pax1蛋白由440个氨基酸残基组成。
Pax2有417个氨基酸单位,主要控制肾脏的形成,Pax2基因的突变会造成肾功能缺失或者肾肿瘤的发生。
Pax3和耳朵、眼睛和面部的发育有关,有479个氨基酸单位。Pax3基因突变会导致耳聋。
Pax4基因和胰腺中分泌胰岛素的b细胞的形成有关,有350个氨基酸单位。
Pax5基因和神经系统发育和生精过程有关,和免疫系统中B细胞的分化也有关系。它有391个氨基酸单位。
Pax6基因是控制眼发育的关键基因,也和其它感觉器官(例如嗅觉)的发育有关。
Pax7基因和肌肉的发育有关,有520个氨基酸单位。
Pax8基因和甲状腺的发育有关,有451个氨基酸单位。
Pax9基因和骨骼牙齿的发育有关,有341个氨基酸单位。
从Pax基因以上的功能看出,Pax基因,同Hox基因一样,也是具体指导各种组织和器官形成的“专业户”。它们从扩散因子中获得指令,在具体的组织和器官中发挥作用。扩散因子正是通过这些“专业户”来具体形成各种组织和器官的。
以上的介绍说明,生物体从一个细胞(分生孢子或者受精卵)发育成为具有复杂结构的生物体,不是依靠DNA直接的结构指令(这些直接的结构指令也并不存在),而是依靠胚胎发育过程中一些细胞或细胞团分泌的扩散性分子控制大范围内其它细胞的命运,使它们向不同的细胞类型方向发展。这些扩散性分子通过具体的“专业户”(例如Hox基因和Pax基因)来具体动员形成一个结构的基因。这些基因再控制下游基因的表达,使细胞产生极性,再通过细胞-细胞之间的直接接触,同类细胞聚集在一起,成为片状或管状的结构,而不同类型的细胞则通过表面结合分子的差别彼此隔离,形成边界,最后导致各种结构的形成。也就是说,生物是通过若干总数不多的成型分子在不同发育阶段、分层次的调控来实现身体的发育过程的。
这是一个动态,多步骤的过程,每一步都会有新类型的细胞产生,而一些新形成的细胞又会通过分泌扩散性分子影像周围细胞的命运。每一步都在前一步的基础上活化新的基因,形成新的细胞和结构。虽然DNA并不含有形成生物结构的直接指令,但是通过多个步骤和层次控制这些基因的有序表达,却可以一步一步发展出各种复杂的结构,最后形成完美的生物体,实现DNA的“蓝图”功能。这真是一个奇迹。看看同窝蚂蚁彼此之间高度的相似性,看看人体结构在世界范围内不同人种之间高度的一致性,就可以体会到生物的成型系统是多么精妙。在随后的文章中,我们将用一些生物结构的形成过程为例,来具体地了解这个系统是如何工作的。
主要参考文献
http://blog.sciencenet.cn/blog-582158-889920.html 此文来自科学网朱钦士博客,转载请注明出处。
上一篇:为什么地球上的生物使用左旋的氨基酸和右旋的糖分子?
下一篇:怎样理解“DNA”是生命的蓝图这句话?(二)
||
怎样理解“DNA是生命的蓝图”这句话?(一)
生物形成身体结构的基本工具
生物结构复杂精妙、巧夺天工的程度让人惊叹。我们的眼睛可以从进入瞳孔的可见光中获得物体的方向、远近、大小、形状、颜色、质地、运动速度等丰富的信息,并且能够通过眼球的转动和晶状体的调节对观察对象进行跟踪和聚焦,还能通过瞳孔的收放适应光线强度的变化。我们的耳朵有接收、传递、放大、转换空气振动状态的专门结构,用于感知环境的变化,包括感知敌友的存在。蝙蝠的耳朵可以接收频率5万赫兹以上的超声波,并且利用超声波的回波来定位。人的耳朵可以辨别从20赫兹到20,000赫兹的连续音频,并且能够从复杂的噪音背景中提取所需要的信息。生物运动器官的效率也令人惊叹,其中猎豹的腿可以使它以每小时110公里的速度奔跑;雨燕的翅膀使它能够以每小时350公里的速度飞行。我们身体的循环系统、消化系统、呼吸系统、排泄系统等,都是高度复杂、效能高度专一的。蜻蜓的复眼、蝴蝶的翅膀、孔雀的羽毛、植物的花朵,都是生物创造出来的结构上的奇迹。我们的大脑更是由上百亿个神经元按照高度有序的方式彼此连接,由此产生感觉、控制、思维、情感,是生物结构发展的最高成就,是我们的世界中构造最复杂,功能最强大的信息处理结构。
问题是,这些精妙的结构是如何形成的?所有的多细胞生物都是由一个细胞分裂发育而来。在细胞数量变大,种类也不断增加的时候,是什么指令让细胞知道自己的位置和“任务”,又是什么机制让细胞形成各种专门结构?我们常说DNA是生命的“蓝图”,它携带着我们身体建造的全部信息,有什么样的DNA,就会发展出什么样的结构。的确,“种瓜得瓜,种豆得豆”,老鼠的DNA也只能“指挥”受精卵发育出老鼠,而形不成猫的结构。科学家甚至可以用一滴鼠血(实则是血中白细胞里面的DNA),就能克隆出一只活的小鼠,证明DNA的确是生命的蓝图。如果DNA没携带生物身体构造的全部信息,又怎么能够指导这些完美生物结构的形成呢?
但是当我们去具体考察一下这份DNA“蓝图”时,却发现它和修建房屋的蓝图不同。修建房屋的蓝图会详细地写明这个房子有几层,有多少个房间、楼梯在哪里、每个房间有多少个门,多少个窗户,以及这些门窗的位置和具体尺寸。灯在哪里、电线从哪里通过、开关在什么地方、水管如何到每一个水龙头等,都必须一一具体注明。总之,有关这栋房子的所有结构信息,都可以在设计蓝图中找到。但是当我们去考察DNA这份“蓝图”时,却只发现为蛋白质编码的序列,以及控制基因表达的序列,仅此而已。在DNA的序列中,根本找不到人有两只手以及两条腿的指令,也找不到规定人的每只手有5根手指的信息。是什么DNA序列规定了舌头和牙齿长在嘴里、鼻子有两个孔、眉毛长在眼睛之上?是什么DNA序列规定心脏有两个心房、两个心室、血管分静脉和动脉?是什么DNA序列能够决定人有多少根头发,长在什么地方?实际上,所有这些有关身体结构的信息,在DNA的序列中都是找不到的。
从许多生物结构的复杂程度来看,要直接把这些信息全部都“写”进DNA序列也是不可能的。人只有2万多个基因,而人的头发就有大约12万根。就算一根头发的位置的信息只需要一个基因来记录,那也是远远不够的,更不要提我们身体里面的60万亿个细胞,它们的结构功能各异,位置不同,要靠区区两万多个基因来记录所有这些信息,可以说是毫无希望。
既然如此,我们又应该怎样来理解“DNA是生物的蓝图”这句话呢?在没有具体的结构指令的情况下,受精卵就能够准确无误地发育成为一个有完美结构的生物体。只要看看采集花蜜的蜜蜂,个个都像工厂里生产出来的产品,彼此之间几乎一模一样,而形成这些结构的信息不过是为蛋白质编码的DNA序列和控制这些序列表达时间和环境的序列,这真是一件难以想象的事情。
生物的蓝图和建造房屋的蓝图,工作方式是不一样的。建造房屋所需要的砖头、木材、水泥、玻璃等自己不会组装成一栋房屋,要靠施工队按照蓝图的指令把这些材料组装在一起。而生物在形成自己的身体时,并没有这样的施工队按需要把各种细胞放到它们应该所在的位置,建造出心脏或肾脏来,而是细胞必须自己“知道”应该是什么类型,“自动”装配成身体里面的各种结构。
这里的关键就在DNA中控制基因有序表达的信息。它决定何种基因在什么对方,在什么时候表达,以及表达多少。这个程序可以决定受精卵在分裂和分化的过程中,如何逐步形成各种类型的细胞。这是从细胞内部来控制细胞的发展方向,即“命运”。除此以外,在人的2万多个基因中,还有一些是为信号蛋白编码的。在生物体发育的过程中,有些细胞就会表达这些信号蛋白,“指挥”周围的细胞进一步变化,从细胞外部控制细胞的发展方向。新形成的细胞中,有一些又会表达另外一些信号蛋白,指挥更多类型细胞的产生。这样一步步发展下去,就会形成我们身体中200多种类型的细胞。这有点像诸葛亮给前方将士的“锦囊妙计”。锦囊里面的指令不是一开始就打开的,而是要到一定阶段才打开。通过在不同阶段打开不同的锦囊妙计,就可以一步步地指挥各种细胞的形成。
但是仅凭这种控制机制,只能形成由各种细胞组成的细胞团,而不能形成特定的结构,包括各种腔、管以及它们的形状、大小、和分支。要形成生物体各种精巧的结构,必须有某种机制来使基因的产物(蛋白质)能够在细胞内和细胞之间产生机械力,让细胞根据这些力来彼此识别、结合、变形,移动位置,从而形成各种精巧的结构。
这种在细胞内和细胞之间产生机械力的根源,其实就是一组为数不多的基因,它们的蛋白质产物可以在生物结构的形成过程中起作用。这组基因的历史可以追溯到单细胞生物,在多细胞生物中它们的功能被“升级”,成为生物体结构的“建筑师”。从水螅到人体,使用的都是同一套基因。这些基因产物(蛋白质)的顺序表达,就可以让细胞之间以特异的方式彼此作用,“自动”形成高度有序的特殊结构。虽然这些基因的数量不多,但是通过用不同的组合方式来使用它们,却可以形成各式各样的结构。这就像木匠的工具只有斧、锤、锯、刨、凿、钻等几种,却可以造出无数种木结构来一样。
基因的顺序表达可以逐步产生不同类型的细胞,而能够产生机械力的蛋白又能够使细胞之间以不同的方式彼此结合,形成生物结构。锦囊妙计分阶段打开,每次的妙计又指挥能够产生机械力的蛋白形成,这两种机制结合起来,就可以构建出一个完整的生物体,DNA的“蓝图”作用也就被实现了。这些在不同的阶段和位置上指挥周围细胞发育的信息分子,以及能够在细胞内和细胞间产生机械力的蛋白分子,就是建造生物结构的“基本工具”。在文章的第一部分中,我们先介绍这些“基本工具”的功能以及它们在结构形成中的作用。在随后的文章中,我们再用具体的例子来表明这些工具是如何造就各种生物结构的。
第一节 通过细胞-细胞直接接触导致结构形成的基因
多细胞生物要形成稳定的结构,首先细胞之间要有稳定的结合。一种让细胞彼此结合在一起的分子就是“钙粘蛋白”(cadherin),因为它需要钙离子才能发挥粘合细胞的作用。其英文名称中的头两个字母ca来自“钙”Calcium,adhe几个字母来自“黏附”adhesion,其中的字母a和ca中的a重合,最后的两个字母in则表示什么“素”。钙粘蛋白的历史非常久远,在被认为是所有动物鼻祖的单细胞生物“领鞭毛虫”(Choanoflagellate)中就已经有钙粘蛋白的表达。单细胞的领鞭毛虫通过它彼此聚在一起成为链状或星状,例如领鞭毛虫家族中的原绵虫(proteospongia),就可以好几个细胞用“尾对尾”的方式聚在一起,共同使用一根柄状物附着在固体上。单细胞生物的这种钙粘蛋白后来就被多细胞生物发展,被用来把细胞彼此黏附在一起。
钙粘蛋白由720-750个氨基酸组成,是一个跨膜蛋白。它含有一个跨膜节段,细胞膜外的部分很大,细部膜内的部分比较小。钙粘蛋白有一个特殊的性质,就是它们的细胞外部分可以彼此结合,即同类蛋白质分子之间的结合,这样表达钙粘蛋白的细胞就可以通过这种蛋白彼此结合在一起。钙粘蛋白在细胞内的部分则通过b-连锁蛋白和(b-catenin)a-连锁蛋白(a-catenin)和细胞里面由肌纤蛋白(actin)组成的“细胞骨架”相连,这样就不仅把结合力施加于细胞膜上,而且还把力延伸到细胞内的骨架上,把细胞牢牢地栓在一起。
如果不同的细胞表达不同量的钙粘蛋白,细胞之间黏附力的强弱就会有所不同。表达钙粘蛋白多的细胞之间黏附力强,就会彼此聚集成团,位于细胞团的核心,而黏附较弱的细胞则包裹在外面。这个过程有点类似于油和水的分相,在无重力的情况下,结合力强的水分子彼此聚集在一起,成为位于液体内部的水球,而结合力弱得多的油分子则包围在水球的外围。这就是最初步的结构形成。在多细胞生物形成的早期,由于细胞表达不同量钙粘合蛋白的机制还不固定,所以这样形成的结构是不稳定的,但是随着细胞调控钙粘蛋白表达量的机制固定下来,细胞按照黏附力分类就可能形成稳定的结构。当然仅靠同一种钙粘蛋白的多少是不足以形成复杂的结构的,大多是实心的多层球体。
经过长期的进化,动物已经有多种钙粘蛋白,由原来的钙粘蛋白基因复制和变化而成。不同类型的细胞表达不同的钙粘蛋白,例如上皮细胞表达E-钙粘蛋白(E表示epithelial),神经细胞表达N-钙粘蛋白(N-表示neural),胎盘细胞表达P-钙粘蛋白(P表示placental),肾脏细胞表达K-钙粘蛋白(K表示kidney),维管上皮细胞表达VE-钙粘蛋白(VE-表示vascular-epithelial),视网膜细胞表达R-钙粘蛋白(R表示retinal)等等。新发展出来的钙粘蛋白也保持了原来的钙粘蛋白的特性,即只有同种的钙粘蛋白才能彼此结合。这样,E-钙粘蛋白就只和E-钙粘蛋白结合,而不和N-钙粘蛋白结合。反过来,N-钙粘蛋白也只和N-钙粘蛋白结合,而不和E-钙粘蛋白结合。这样,表达E-钙粘蛋白的上皮细胞就不会和表达N-钙粘蛋白的神经细胞结合。如果把表达不同钙粘蛋白的细胞混合在一起,他们就会按照在细胞表面表达的钙粘蛋白的种类自动分类,同种细胞彼此结合在一起,而不和其他种类的细胞相混,这样就可以使不同类型的细胞自动分类,分别聚集成为各种组织。随着动物身体复杂性和细胞种类的增加,钙粘蛋白的种类也不断增多。例如无脊椎动物总共有不到20种钙粘蛋白,而脊椎动物的钙粘蛋白超过100种,光是人类就有80多种钙粘蛋白,成为人体各种组织中细胞自动分类聚集的基础。
钙粘蛋白虽然是细胞分类聚集的重要机制,是细胞分类聚集的基础,但是仅由钙粘蛋白导致的细胞分类聚集只能形成实心的细胞团,而不能够形成腔、管等更复杂的结构。这些结构的形成需要其他的“工具”。
细胞的极化是形成面、片、腔、管的基础
在上一部分的讨论中,我们假设钙粘蛋白在细胞表面上的表达是均匀的,即在细胞膜的各个部分表达的程度都一致。在这种情况下,细胞之间通过钙粘蛋白形成的结构就只能是实心的球形结构。我们把这种状态的细胞称之为没有“极性”的,即细胞的性质在各个方向上都相同。但是多细胞生物中,如果所有的细胞都是没有极性的,那就只能形成实心的球状结构,各种复杂的结构如片、腔、管就无法形成了。所以在多细胞生物体中,许多细胞都带有一定的极性,即细胞的形状和结构不是中心对称的,在不同的方向上,细胞膜的组成、细胞内蛋白质和RNA的分布、细胞骨架纤维的走向、细胞核和中心粒的位置,都是不对称的。我们把细胞结构在各个方向上的不对称性叫做细胞的“极性”(polarity),而细胞从非极性状态转变为极性状态叫做细胞的“极化”(polarization)。细胞的极化在形成复杂结构上非常重要。
例如细胞如果只在侧面表达钙粘蛋白,而上下面(分别称为“顶面”和“底面”)不表达,细胞就能够连成片状,而不再聚集成球状,因为顶面和底面的细胞膜无法彼此粘合。如果底面的细胞膜上再有和细胞外基质结合的分子,片状结构中的细胞就都以底面和基质结合,这样顶面就成为唯一能够和外部空间接触的细胞面。生物体里的“上皮”(epithelium)就是这样形成的,这种片状结构里面的细胞也被称之为“上皮细胞”(epithelial cells)。
上皮的形成是多细胞生物发展史上的重大事件,从此生物就有了一层细胞来区分身体的“外”和“内”。如果细胞膜是细胞的“墙壁”,那么上皮就是生物体的“墙壁”。处于生物体内部的细胞就有了比较稳定的内环境,而不像单细胞生物那样始终暴露在复杂多变的外部环境中。在这样相对稳定的内环境中,生物体就可以发展出更加复杂的结构来,而且许多这些结构的“内表面”仍然由上皮组成。除了我们身体外部的皮肤表面,我们身体内部粘膜的表面、血管和淋巴管的内壁、小肠的内壁、肺泡中和空气接触的细胞、肾脏的肾单位(nephron)、各种分泌腺体内围绕着把分泌物输送出去的管道的细胞,都由上皮组成。这些上皮的结构都类似,即细胞以侧面相互连接,细胞底部通过“整联蛋白”(integrin)与由细胞外基质组成的“基膜”(basal lamina)连接,而细胞顶部暴露于外部空间或腔管的内部空间,可以长出各种结构,用来执行各种生理功能,例如小肠的肠壁细胞的顶面长出许多绒毛,用来吸收营养;气管内壁的细胞长出许多纤毛,通过它们的定向摆动清除痰液;分泌腺的上皮细胞的顶端则是细胞分泌各种分子的地方。
如果上皮细胞的顶端能够收缩(通过顶端区域的肌纤蛋白actin和肌动蛋白myosin),细胞的顶部就会变尖,在上皮的暴露面上产生拉力,使得原来是平面的片状结构卷曲,卷曲进行到一定的程度,就能形成腔或者管。在管的一些特定部位上皮细胞的顶端再收缩,就可以在管上形成分支,例如气管就这样分为支气管,支气管再不断分支,最后形成肺泡。血管也可以这样分支,最后形成毛细血管。所以通过细胞极性的形成和变形,就可以形成面、片、腔、管等结构。
在上皮细胞的侧面,钙粘蛋白在细胞之间形成“粘着连接”(adherensjunction)。钙粘蛋白的细胞外部分彼此结合,细胞内部分则通过a-连锁蛋白和b-连锁蛋白与细胞里面由肌纤蛋白组成的“细胞骨架”相连。由于上皮是和外界接触的地方,为了防止分子从细胞之间“溜”进来,让外部分子必须通过顶端膜这个“海关”,细胞之间在靠近顶膜的地方还形成“紧密连接”(tight junction)。紧密连接由“紧密连接蛋白”caludin和eccludin组成。紧密连接还有另外一个重要功能,就是防止顶端膜和测面的膜成分彼此混合。上皮细胞之间的这些紧密联系使得他们在上皮中的位置固定而难于移动。
并不是身体里面所有的细胞都是上皮细胞,身体里面还有另外一类细胞,它们没有明显的极性,彼此之间并不紧密结合,例如结缔组织里的细胞,包括血细胞、脂肪细胞、骨细胞、软骨细胞、筋腱里面的细胞、神经系统中的神经细胞和胶质细胞等。这些细胞来自一类没有或很少极性,可以移动位置的细胞,叫做“间充质细胞”(mesenchymalcells)。在胚胎发育过程中,常常需要细胞移位,到达别的地方,在那里形成新的组织和器官,而这是没有移动能力的上皮细胞做不到的,这个任务就由间充质细胞来完成。
间充质细胞是由胚胎发育过程中的上皮细胞失去极性而形成的,这个过程叫做“上皮-间充质转化”(epithelail-mesenchymal transition,简称EMT)。在这个过程中,钙粘蛋白的表达被抑制,细胞之间粘连减弱或消失,细胞获得迁移和侵袭组织的能力,在胚胎发育中起重要作用。例如神经脊细胞(neural crestcells)就是可以移动的细胞,它们由胚胎的神经外胚层(neuroectoderm)的上皮细胞通过上皮-间充质转化而来。它们能够运动到身体各处,形成神经细胞、胶质细胞、头面部的软骨细胞和骨细胞以及平滑肌细胞等。上皮细胞在转变成癌细胞时,也要进行上皮-间充质转化,使自己脱离黏附,获得迁移和侵袭组织的能力,因此恢复这些细胞的极性也是治疗癌症的一个途径。
在胚胎发育中,间质细胞也可以反向转化,即“间充质-上皮转化”(mesenchymal-epithelialtransition, 简称MET),重新变回上皮细胞。在器官的形成过程中,常常需要细胞在上皮和间充质两种状态下来回转化,通过间充质细胞阶段获得迁移能力,又在最后的位置变回上皮细胞,形成各种结构。例如组成肾脏的“肾单位”中的上皮细胞就是由“生肾间充质细胞”(nephrogenic mesenchymal cells)通过间充质-上皮转化变来的。这些事实说明,细胞的极化和去极化在胚胎发育,形成各种组织和器官的结构上起关键的作用。
形成和维持细胞极性的原理
从我们对细胞的基本了解来看,细胞的极性化似乎是一件比较难于理解的现象。蛋白质在细胞中是可以向各个方向扩散的,而细胞膜也是动态的,里面的磷脂和蛋白质处于连续不断的流动和移位之中。这些随机的过程似乎只能使细胞的结构均匀化,就像糖分子在一杯水中最后会平均分布在水的各部分一样,怎么会出现分子在细胞的各个方向分布不均的情况呢?
有两个机制可以使细胞的极性出现。一个是正反馈机制。如果一种分子在细胞膜的某处由于某些原因浓度比在其它地方稍高一些,它又能够通过与其它分子之间的相互作用招募其它分子来这个位置,而新到来的分子又能够促进头一种分子在该位置聚集,这就是一种正反馈机制,可以导致分子或分子团的不均匀分布。一个类似的例子是白蚁建蚁山(白蚁的窝)。一开始白蚁在地表随机地堆砌土块,所以地上会出现一片基本均匀的小土粒。但是白蚁有一个习惯,就是往最高的那个土块上堆新土,这样土块的增高速度就不是平均的了,而是在当初稍大的土块上有更多的白蚁在堆土,这样这个土块就会逐渐明显高于其它土块,使得后来所有的白蚁都往这个土块上堆土,最后形成单一的土山。这就是正反馈造成物质分布不均的例子。
第二个机制是蛋白分子团之间互相排斥,或者说互相“拆台”,这样它们就不可能进入对方的“领地”,只能在细胞的不同位置存在。如果其中一种或者两种蛋白团在膜上又有能进行正反馈的位置,这两个蛋白团就不可能在细胞中均匀分布了,而是分别分布在膜内不同的地方。例如有两个蛋白质聚成的蛋白团,一个由A、B、C三种蛋白质组成,只有三种蛋白质都存在时蛋白团才稳定。另一个蛋白团是由D、E、F三种蛋白质聚合而成,也都需要三种蛋白质都存在才能成为稳定的聚合物。三种蛋白质彼此结合,形成稳定的复合物,就是一种正反馈机制。设想A、B、C中的任何一种蛋白在进入DEF的领地时,DEF能够使它失活,不能和其它两种蛋白质形成聚合物,那么在DEF的领地里就不可能有ABC聚合物的存在。反过来,如果ABC聚合物能够使进入其领地的D、E、F蛋白失活,不能和其它两种蛋白质形成稳定聚合物,那么在ABC的领地里也不会有DEF聚合物形成。从细胞形成极性的过程来看,这两种机制都起了作用。下面我们就具体来看看这两种机制是如何发挥作用,造成细胞的极化的。
形成和维持细胞极性的蛋白质
(1)Par复合物
1988年,美国科学家Kemphues等在研究线虫(C. elegans)的胚胎发育时,发现了6个基因,它们的突变使线虫的胚胎只能形成无结构的细胞团,而不能形成正常的组织和器官。科学家们把这6个基因称为“分隔缺陷基因”(partition defective),简称Par基因,从Par-1到Par-6。所有这些基因的产物都是可溶性蛋白,都位于细胞质中。虽然这些蛋白都叫Par蛋白,但是它们只是为细胞的极性所需,并不是同类的蛋白质。例如Par1和Par4是蛋白激酶,即可以在蛋白质分子上加上磷酸基团,改变其性质,让其活化或失活的酶。在线虫一个细胞阶段的胚胎中,这些Par蛋白的分布就是不均匀的,其中Par-3和Par-6位于胚胎的前端,Par-1和Par-2位于胚胎的后端,Par-4和Par-5则平均分布。如果突变这些基因中的任何一种,胚胎的极性就消失。如果让Par-3基因突变,Par-1和Par-2就不再位于胚胎后端,而是均匀分布了,说明这些Par蛋白之间在位置上是互相拮抗的。
1990年,日本科学家Tabuse等在线虫中发现了另一个Par蛋白,这个基因的突变造成的后果和其它Par基因突变的效果一样。这个基因的产物也是一个蛋白激酶,叫做“非典型的蛋白激酶C”(atypical protein kinase C,简称aPKC)。蛋白结合试验表明,Par-3、Par-6和aPKC彼此结合,形成一个蛋白复合物,而且只有在形成这个复合物后,这些蛋白质才能在细胞中不对称分布。这就类似于前面讲过的A、B、C三种蛋白组成稳定蛋白复合物的例子。
在上皮细胞中,Par-1是以二聚体的形式存在于基底膜和侧膜位置的。如果Par-1扩散到顶端膜,Par-3/Par-6/aPKC复合物中的aPKC能够使Par-1磷酸化,让它结合于在细胞质中的Par-5,使它不能停留在顶端膜上。反过来,如果Par-3运动到基底膜和侧膜,Par-1又能够使Par-3磷酸化,让它与Par-5结合,而不能在基底膜和侧膜停留。
随后在果蝇和哺乳动物(包括人)中的研究表明,Par蛋白质在比线虫更高等的动物细胞中也都存在,而且Par-3/Par-6/aPKC复合物也都在细胞的极性中起不可缺少的作用。这个复合物位于线虫胚胎的前端、爬行细胞的前沿、神经细胞生长中的轴突的顶端、以及上皮细胞的顶部,因此这个复合物在细胞的各种极性状态或过程中都发挥作用,是一个有古老历史,几乎所有动物,从线虫到人,都使用的极性蛋白。
(2)Crumbs复合物
1990年,德国科学家Tepass等人在果蝇的上皮细胞中发现了一种膜蛋白,它只位于上皮细胞顶端膜上,在靠近细胞之间连接的地方浓度最高。为这个蛋白编码的基因突变会使上皮细胞的顶端膜消失,严重干扰果蝇上皮的结构,有时甚至导致这些细胞的死亡,而过量表达这个基因又会使顶端膜扩张,说明这个基因对上皮细胞的极性,特别是顶端膜的形成和稳定,有非常重要的作用。由于这个基因的突变使得果蝇身体表面的角质层呈碎裂状,所以这个基因被称为“碎裂基因”(Crumbs),平常被称为Crb基因。
和Par蛋白是水溶性的分子不同,Crb蛋白是一个膜蛋白,有一个跨膜区段。它的细胞内部分有一段37-40个氨基酸残基组成的肽链,对于它的功能是必要的,去除这个部分后,Crb蛋白对上皮细胞极性的作用就消失。这个细胞内的部分能够结合一个蛋白叫PALS-1(protein associated with Lin7, Stardust)。PALS-1又和另外一个蛋白PATj(PALS-1 associated tightjunction protein)结合。因此,Crb蛋白和Par蛋白一样,也形成一个由三个蛋白质组成的复合物Crb/PALS-1/PATj。这三个蛋白质对于复合物的稳定性和功能都是必要的,PALS-1基因和PATj基因的突变都和Crb基因的突变有相同的效果,使钙粘蛋白的分布错位,不能在细胞之间形成粘着连接,导致结构异常。。
Crb蛋白除了和PALS-1和PATj蛋白形成复合物外,Crb蛋白的细胞内部分还能够和Par复合物中的Par-6结合,这样Crb复合物Par复合物就彼此联系,共同存在于上皮细胞的顶端膜内。不仅如此,在顶端膜内,肌纤蛋白(actin)和血影蛋白(spectrin)一起组成网状的细胞骨架,以支持顶端膜。Crb复合物和Par复合物结合后,Par复合物中的aPKC能够使Crb蛋白的细胞内部分磷酸化,使它可以和血影蛋白结合,这样Crb复合物和Par复合物就与顶端膜内的细胞骨架相联系,进一步稳定它们在上皮细胞顶端的存在。
(3)Scribble 复合物
在果蝇的突变试验中,科学家还发现了另一类和细胞极性有关的基因。其中一个基因的突变会使果蝇的角质层起皱多孔,因此被起名为“Scribble”(简称Scrib),意思是“乱涂乱画”。突变体果蝇的细胞失去极性,性状变圆,不再形成单层上皮,而是互相堆积,说明Scrib基因也是为上皮细胞的极性所需要的。
和Par蛋白和Crb蛋白都形成由三个蛋白质形成的复合物一样,Scrib蛋白也和另外两个蛋白质形成由三个蛋白质组成的复合物。这两个蛋白分别是“Dlg”(lethal disc large)和“Lgl”(lethal giant larvae)。
与Par复合物和Crb复合物在细胞内的位置不同,Scrib复合物Scrib/Dlg/Lgl并不位于顶端膜下,而是在侧膜区。这个复合物的作用看来是排斥Par复合物和Crb复合物,让它们只位于顶端膜,而不能到侧膜区来。突变Scrib复合中的任何一个基因,都会使前两个复合物中的蛋白失去它们在顶端膜的定位,而变为在细胞中平均分布。E-钙粘蛋白也失去了它们在细胞侧面的定位,变为在细胞膜的所有位置都有分布,使细胞的极性黏附丧失。因此Scrib复合物和前两个复合物是彼此拮抗的。
(4)细胞膜成分的不对称分布
除了Par、Crb、和Scrib这三个蛋白复合物在上皮细胞中的不对称分布外,顶端膜和基底侧面膜所含的一种磷脂成分也不相同。磷脂(phospholipid)是以甘油分子(丙三醇)为核心的分子。甘油的三个羟基中,有两个(包括中间的那一个)通过脂键与脂肪酸相连,另一个羟基与磷酸根相连,磷酸根上再连上其它亲水的分子,例如丝氨酸、乙醇胺、胆碱、肌醇等,这样形成的分子分别叫做“磷脂酰丝氨酸”、“磷脂酰乙醇胺”、“磷脂酰胆碱”和“磷脂酰肌醇”。其中磷脂酰肌醇(phosphatidylinositol,简称PI)的磷酸化产物是重要的信息分子。
肌醇(inositol)的化学结构是“环已六醇”,即6个碳原子连成环状,每个碳原子上面连一个氢原子和一个羟基。在6个羟基中,1号碳原子上的羟基与磷脂分子上的磷酸根相连,4、5、6号碳原子上的羟基都可以被磷酸化,但是2号和6号碳原子上的羟基(即和1号碳原子相邻的羟基)不会和磷酸根相连。4、5、6号碳原子上的羟基各由不同的激酶磷酸化。最先被磷酸化的是4号位的羟基(被磷脂酰肌醇-4-激酶催化,用ATP作为磷酸根的供体),生成“磷脂酰肌醇-4-磷酸”(phosphatidylinositol-4-phosphate,简称PI4P,或PIP)。PIP-5-激酶能够使PIP分子中第5号碳原子上的羟基磷酸化,生成“磷脂酰肌醇-4,5-二磷酸”(phosphatidylinositol-4,5-biphosphate,简称PI(4,5)P2,或PIP2)。PIP2还可以进一步被磷酸化,通过PIP2-3-激酶使第3号碳原子上的羟基磷酸化,生成“磷脂酰肌醇-3,4,5-三磷酸”(phosphatidylinositol-3,4,5-triphosphate,简称PI(3,4,5)P3,或者PIP3)。读者不必为这些复杂的名称费脑筋,只需要记住PI是磷脂酰肌醇,PIP是磷脂酰肌醇上连一个磷酸根,PIP2连两个磷酸根,PIP3连三个磷酸根就行了。
在上皮细胞中,PIP2位于顶端膜上,而PIP3位于基底侧膜上。细胞之间的紧密连接(tight junction)则把这两个部分的细胞膜分隔开来,不让这两部分细胞膜的成分互相交换混合。位于顶端膜的PIP2能够和“膜联蛋白2”(annexin2)结合,膜联蛋白又和Cdc42蛋白结合,Cdc42又可以招募par复合物中的Par-6和aPKC到顶端膜并且活化它们,和Par-3形成最后的复合物,如果人为地把PIP2引入基底侧膜,基底侧膜就变得像顶端膜,所结合的蛋白质也会改变。所以PIP2可以对Par复合物的定位起引导作用。
反过来,如果人为地把PIP3引入顶端膜,就会把顶端膜的性质变为基底侧膜,所连的蛋白质也相应变化。除了紧密连接能够防止顶端膜中的PIP2和基底侧膜上的PIP3相混以外,在顶端膜上还有一个叫PTEN的磷酸酶(phosphatase and tensin homolog),它可以把PIP3脱去一个磷酸根,变成PIP2,这样PIP3在顶端膜就没有存在的可能。同样,在基地侧膜上有一个PIP2的激酶(phosphatidylinositol-3-kinase,简称PI3K),可以在PIP2上加上一个磷酸根,把PIP2变成PIP3。这样PIP2也不能在基地侧膜区域存在。
从以上的叙述可见,Par复合物、Crb复合物和Scrib复合物各由三个蛋白组成,而且都要三个蛋白质存在才能形成稳定的复合物,这就提供了一个正反馈的机制,即复合物中的每一种蛋白都起稳定对方的作用。Par复合物和Crb复合物之间的联系,顶端膜中PIP2对Par复合物的定位引导作用,组成更高一层的正反馈机制。而Par复合物、Crb复合物和Scrib复合物之间的拮抗,使得前两种复合物不能和Scrib复合物位于细胞中的相同位置。细胞中的分子虽然是动态的,但是通过这些机制,细胞却可以被极化,极化的细胞就可以连成片状、形成上皮,并且进一步形成腔和管的结构。参与这些过程的蛋白质是高度保守的,从线虫到哺乳动物,用的都是同一套基因。
这些复合物不仅自身在细胞内不对称分布,他们还通过“Rho GTP酶”影响细胞内由细胞骨架构成的运输系统的方向。例如通过顶端膜分泌的蛋白质就是通过这些通路从高尔基体运送到顶端膜的,而不会向基底侧膜方向运输;基底侧膜所需要的蛋白质也不会向顶端膜运输。物质的定向运输又进一步增强和巩固细胞的极性,因此这些系统是彼此联系并且彼此促进的。
让上皮里面的细胞在平面上也有方向性——促成“平面细胞极性”的基因
上皮里面的每个细胞都具有顶端-基底端方向的极性,这个极性的方向是与上皮的平面垂直的,通过Par、Crb、和Scrib三个蛋白复合物的不对称分布来调节控制的。除了这个垂直方向上的极性,上皮细胞还有另外一种极性,其方向和上皮的平面方向相平行。这种极性对于生物结构的形成也非常重要。例如昆虫体表和翅膀上的纤毛都朝向一个方向;鱼的鳞片都朝向尾部;哺乳动物皮肤上的毛发朝向一致;人眉毛的方向也都朝向脸的外侧;气管上皮细胞上的纤毛朝向口鼻的方向,摆动方向也一致,等等。这种和上皮的平面方向平行的极性叫做平面细胞极性(planar cellpolarity),其方向要根据一个器官(例如昆虫的翅膀)朝向身体的方向和远离身体的方向定义为近端和远端,或者根据生物身体的前后方向定义为前端和后端。
和顶端-基底端极性一样,平面细胞极性也是由不同蛋白质或蛋白复合物的不对称分布所造成的,不同的是在顶端-底端极性中,蛋白复合物都位于细胞内,由它们在细胞内的位置决定细胞极性的方向,这些蛋白复合物的位置是纵向(即顶端-基底端方向)不对称的。而在平面细胞极性中,有关的蛋白质或蛋白复合物的分布是在上皮的平面方向上不对称的,而且能够通过它们在细胞外的部分与相邻细胞表面对应的复合物相互作用。
引起平面细胞极性的蛋白质有两组,第一组包括“Fmi/Pk/Vang复合物” 和“Fmi/Fz/Dgo/Dsh复合物”。前者位于细胞侧面的前端或近端,后者位于细胞侧面的后端或远端。这两个复合物在细胞内的位置是互相排斥的。位于一个细胞远端膜上的Fmi/Fz/Dgo/Dsh复合物只能够和它远端方向相邻细胞上的Fmi/Pk/Vang复合物结合,同时,位于这个细胞上近端膜上的Fmi/Pk/Vang复合物又只能和位于它近端邻近细胞上的Fmi/Fz/Dgo/Dsh复合物结合。这样,上皮里面的细胞就能够以“首尾相连”的形式呈有方向性的排列和结合,导致平面极性。上面说的这些蛋白质的名称都是简称,它们的全称是:Fmi——Flamingo/starrynight;Pk——Prickle;Vang——Van Gogh/strabismus;Fz——Frizzled;Dgo——Diego;Dsh——Dishevelled。这些都是科学家发现这些蛋白或基因时根据它们的性质或功能给它们取的“小名”,例如“火烈鸟”、“凡高”、“星空”、“针刺”、“蓬乱”等等,不用感到奇怪。
另一组包括两个蛋白,分别是Ds(Dashsous)和Ft(Fat)。它们都是类似钙粘蛋白的分子,能够以它们的细胞外部分彼此结合。但是它们和钙粘蛋白不同的是,同种的分子并不彼此结合,例如Ds和Ds分子的细胞外部分就不能彼此结合,而必须与Ft的细胞外部分结合。Ds和Ft都是细胞侧面膜上的分子,在细胞中膜上的分布也是不对称的,Ft位于细胞的前端或近端,Ds位于细胞的后端或远端。它们在细胞膜上的位置也互相排斥。这样,相邻细胞间的Ft和Ds也能够使细胞以“首尾相连”的方式排列和结合,形成
“前端——Ft细胞Ds——Ft细胞Ds——Ft细胞Ds——后端
这样的连接方式,导致这些细胞的平面极性。
上皮细胞的平面细胞极性和顶端-基底端极性一样,都是为生物胚胎的正常发育所需要的,上面说的那些蛋白质基因的突变也会严重影响胚胎的发育,例如人类新生儿中的脊柱裂和无脑儿就是因为平面细胞极性的机制不正常引起的神经管畸形引起的。
使相邻的细胞有不同命运的蛋白质——Notch和它的底物分子
多细胞生物是由不同类型的细胞组成的。在细胞分化过程中,基因调控的改变可以使细胞朝向不同的路线转变,赋予它们不同的命运。除了细胞内的基因调控,细胞之间的相互作用也能够使相邻的细胞向不同的细胞类型发展,形成不同类型的细胞,这就是Notch及其底物分子的作用。
1914年,John Dexter 在美国科学家David P. Morgan的实验室工作期间,发现了一种果蝇的突变种,这些果蝇的翅膀边沿上有缺口。1917年,Morgan发现了引起这个缺陷的基因,并且把它叫做“缺口基因”(Notch)。
进一步的研究发现,Notch基因的产物是一个膜蛋白,有一个跨膜区段,一个比较长的细胞外区段,和一个比较短的细胞内区段。细胞外区段用来和它的底物(substrate)结合。Notch的底物分子有两种,在果蝇中分别叫做“Delta”和“Serrate”。在哺乳动物中,对应的底物分子是“Delta-like”和“Jagged”;在线虫中是“glp-1”和“Lin-12”。它们也都是膜蛋白,有一个跨膜区段和细胞外区段,其中细胞外区段用来和Notch的细胞外区段结合。由于Notch蛋白和底物蛋白都是膜蛋白,所以它们要彼此结合,需要细胞-细胞的直接接触。
底物蛋白Delta或者Jagged和Notch分子结合后,细胞膜内的一个蛋白酶就把Notch蛋白的细胞内部分切下来。这个被切下来的Notch细胞内部分随后进入细胞核,在那里影响一些基因的表达。因此,Notch蛋白是接收和传递来自另一个细胞信号的分子,是外来信号分子的受体,信号通过Notch的细胞内部分传递到细胞核中去。
在Notch蛋白和底物分子结合以前,细胞核中一个叫做CSL的转录因子处于和一些有抑制作用的蛋白质结合的状态,这时CSL蛋白质起到关闭基因的作用。(CSL是三个同类蛋白的合称,即哺乳动物中的CBF1/Rbpj,果蝇中的Su(H),以及线虫中的Lag-1)。Notch的细胞内部分进入细胞核后,会和CSL蛋白质结合,改变它的形状,使它和那些起抑制作用的蛋白质脱离,改而结合一些起活化作用的蛋白质,这样CSL蛋白的作用就从关闭基因转变为打开基因。被打开的基因(Hes-1)合成的蛋白质(HES蛋白)是具有抑制作用的转录因子,会关闭一些细胞里面的基因,这样,接受Notch底物信号的细胞和发出信号的细胞(即表面有Delta或Jagged的细胞)基因调控状态就不一样了,它们也会形成不同类型的细胞。
在一群细胞中,即使一开始每个细胞都表达Notch蛋白和底物蛋白,但这是一种不稳定的状态,Notch蛋白接收信号和改变细胞状态的作用会逐渐使得一些细胞只表达Notch蛋白,一些细胞只表达底物蛋白,这样,表达底物分子的细胞就能防止表达Notch蛋白的细胞和自己有一样的命运。
这个通过细胞之间的接触改变另一个细胞命运的机制叫做“侧向抑制”(lateral inhibition),它使相邻的两个细胞走向不同的命运。如果这两个细胞随后表达不同的钙粘蛋白,它们就会各自与和自己同类的细胞连接,形成不同类型细胞之间的边界。这个机制在胚胎发育过程中起到非常重要的作用。例如胰脏细胞分化为外分泌细胞(分泌消化液到肠腔中去)和内分泌的细胞(分泌胰岛素进入血液)这两种细胞时,Notch信号传递就起了关键的作用。许多组织器官的形成过程都和Notch信号传递链有关,例如血管生成过程中内皮细胞的形成、心脏形成过程中心肌细胞和心内膜细胞的分化、心脏瓣膜的形成、消化道中起分泌作用的细胞和起吸收作用细胞之间的分化、乳腺发育等,都是通过Notch信号传递来实现的。
小结
在这一节中,我们看到了4种细胞之间的连接方式和它们在形成生物结构过程中的作用。
首先是细胞之间通过钙粘蛋白的结合。只有同类的钙粘蛋白才能够彼此结合,因此,表达不同钙粘蛋白的细胞会按照它们所表达的钙粘蛋白的种类而“自动”分类聚集,形成不同的细胞团块。细胞之间的连接是对称的,即提供连接的分子都相同。这样的连接方式不会使一个细胞影响另一个细胞的命运。
第二种是细胞的极性连接,即钙粘蛋白只在细胞的侧面把细胞粘连在一起。这样细胞就不再形成团,而是形成片。在片中的细胞有顶端-基底端方向的极性,顶端面向外部空间,基底端和基膜相连,形成上皮。细胞之间不仅有由钙粘蛋白形成的粘合连接,还有由“紧密连接蛋白”caludin和eccludin组成紧密连接。这种顶端-基底端的极性是由Par、Crb和Scrib三个蛋白复合物在细胞内的不对称分布引起和维持的。Par复合物和Crb复合物位于顶端,而Scrib复合物位于细胞的基底侧部分。在这种连接方式中,每个细胞提供的粘连分子仍然是一样的,它们之间的连接也不改变彼此的命运,只是由于细胞的极化使细胞的聚集方式从团状变为片状。上皮细胞顶端的收缩还能够使片卷成腔和管。
第三种连接方式还是片状的,但是由于相邻细胞之间用于粘连的蛋白分子不同,即不对称,一边是Fmi/Pk/Vang复合物,一边是Fmi/Fz/Dgo/Dsh复合物;一边是Ft,一边是Ds,这样平面里面的细胞就有了在平面方向上的极性,叫做“平面细胞极性”,在决定上皮上面长出来的结构(如纤毛、羽毛、鳞片、毛发)的方向上起关键作用。但是细胞这样不对称的连接并不使细胞的基因调控彼此不同,也不使细胞向不同的方向分化。
第四种连接是通过Notch蛋白和它的底物分子之间的连接,一边是Notch受体蛋白,一边是Delta和Jagged信号蛋白。由于Notch蛋白接收信号后会改变细胞的基因调控状态,细胞之间这种方式的接触会使它们向不同命运的方向发展。如果随后它们表达不同的钙粘蛋白,这些不同的细胞就会各种聚集,形成不同细胞和组织之间的边界。
因此,通过细胞-细胞之间的直接接触,就可以通过不同的接触方式形成不同的细胞种类和结构。这是生物发育过程中所使用的一些“成型工具”,原理虽然简单,效果却非常好,所以从线虫和哺乳动物都共同使用这些工具。另一方面,这些工具的使用需要细胞-细胞的直接接触和相互作用,因而作用只能是短距离的。为了在整体上形成复杂的生物结构,生物还需要在长距离上起控制作用的信号分子。
第二节 远程控制生物结构形成的“上层指挥”——扩散性信号分子
通过接收外来分子的信号,改变自身状况的能力,在单细胞生物中就已经出现了。例如细菌能够感知周围营养物质浓度的差别,向营养物质浓度高的方向运动。粘菌中的“盘基网柄菌”(Dictyostelium discoideum)能够感知其它粘菌分泌的环单磷酸腺苷(cAMP),彼此相聚而形成孢子体,其中有的细胞变成柄部的细胞,而且分为柄的表面细胞和柄内部的细胞,有的则变成孢子。
多细胞生物则进一步发展这种能力,通过分泌可以在细胞之间移动的分子,影响近程或远程细胞的活动状况或者命运。与上面说的需要细胞-细胞直接接触的分子不同,由于这些分子可以在细胞之间移动,它们能够影响的细胞就不只一个,而是一群。改变了命运的细胞再表达出特殊的细胞之间作用的分子,从而形成生物体内的各种组织和器官。这类分子为数不多,但是由于它们的作用机制不同,再通过下游分子的相互作用,却可以在比较大的范围内控制各种复杂的结构的形成,是生物结构形成的上层控制机制。
Wnt基因和信号通路
1976年,Sharma 和 Chopra 发现,果蝇中的一个基因突变,会使果蝇的翅膀丧失,他们把这个基因取名为“无翅基因”(wingless,简称Wg)。6年之后,美国科学家Roel Nusse和Harold Varmus 发现在小鼠乳腺肿瘤病毒中含有一个致癌基因,他们把这个基因称为“整合基因”(integration 1,简称int1基因)。随后的研究发现,这两个基因实际上是同一个基因,从线虫、果蝇、斑马鱼、青蛙、小鼠到人类都含有这个基因,在动物胚胎的发育和器官形成中起重要作用,因而科学家把这两个名称综合起来,把这个基因称为“Wnt基因”,即Wg中的W和int中的nt的结合。
Wnt基因的产物是一个被分泌到细胞外的蛋白质,说明它的作用不需要细胞-细胞之间的直接接触,而可以在比较长的距离上起作用。Wnt蛋白由350-400个氨基酸残基组成,其中有23-24个半胱氨酸残基,这些半胱氨酸残基中的一些上面连有脂肪酸(棕榈酸,即软脂酸)。Wnt蛋白上还连有糖基,以保证它被细胞分泌出去。由于Wnt蛋白上有脂肪酸和糖基,这个蛋白能够和细胞膜相互作用,因此常常临时附着在细胞表面,通过不断地附着-解离,Wnt蛋白就能够在细胞之间移动,影响位置较远细胞的命运。
Wnt蛋白质传递信息的方式,是和细胞表面一个叫“卷曲蛋白”(Frizzled,简称Fz)的膜蛋白结合,使Fz蛋白活化。活化了的Fz蛋白把信号传给细胞质中的“蓬乱蛋白”(Dishevelled,简称Dsh)。Dsh蛋白能够阻止b-连锁蛋白(b-catenin)的降解,使b-连锁蛋白在细胞中集聚。b-连锁蛋白不仅在细胞之间通过钙粘蛋白(Cadherin)的结合中起重要作用,而且可以进入细胞核,与T细胞因子(Tcell factor / lymphoid enhancer factor,TCF/LEF)相互作用,影响一些基因的表达,从而改变细胞的命运。在没有Wnt信号时,细胞质中的b-连锁蛋白是不断被降解的,上述的基因调控也不会发生,而Wnt信号使得b-连锁蛋白不被降解,发挥调控基因的作用。这是Wnt蛋白作用的“经典途径”。除此以外,Wnt信号传递也可以走非经典途径,即不通过b-连锁蛋白,而是和细胞骨架起作用,使肌纤蛋白(actin)丝的方向极化,导致细胞的极性(顶端-基底端极性)和平面细胞极性。
Wnt蛋白质在动物的胚胎发育中起重要作用,它可以帮助形成动物身体的前后轴线和背腹轴线,而且通过影响细胞的增殖和运动,参与器官的形成,例如肺、卵巢、神经系统和四肢。我们将在后面谈一些器官的形成时再谈到Wnt蛋白的作用。
“刺猬蛋白”(Hedgehog protein)
同Wnt基因一样,为胚胎的正常发育所需要的另一个基因也是首先在果蝇中发现的。为了寻找为果蝇胚胎正常发育所需要的基因,德国科学家Christiane Nüsslein-Volhard和Eric Wieschaus用突变剂“乙基甲磺酸脂”(Ethyl methanesulfonate,简称EMS) 对果蝇进行“饱和突变”,然后观察这些突变的效果。他们的这项研究发现了一组与果蝇胚胎发育有关的基因,这些科学家也因此获得了1995年的诺贝尔生理或医学奖。
在Nüsslein-Volhard和Wieschaus在果蝇中发现的基因中,有一个叫做“刺猬基因”(Hedgehog,简称Hh)因为有这个突变的基因会使果蝇的胚胎变得短圆并有密集的刚毛,样子类似刺猬。哺乳动物有三个Hh基因,分别为三种刺猬蛋白编码,叫做“音刺猬因子”(Sonic Hedgehog,简称Shh)、“印度刺猬因子”(IndianHedgehog,简称Ihh)、和“沙漠刺猬因子”(Desert Hedgehog,简称Dhh)。它们在生物胚胎发育和组织器官形成上起非常重要的作用,其中音刺猬因子被研究得最详细。
音刺猬因子在细胞中首先被合成为一个45kDa的前体分子,这个分子随后被切成两段,其中氨基端部分约20kDa,羧基端部分约25kDa。在前体分子被切成两段时,羧基段把一个胆固醇分子加到氨基段的羧基端上,这个被加上胆固醇的氨基端部分随后被分泌到细胞外,作为信号分子,与细胞表面的受体相作用。所以Shh分子和Wnt蛋白一样,也是被分泌到细胞外,可以在细胞间移动的分子,能够在比较长的距离上传输信息。由于Shh分子上带有一个胆固醇分子,具有亲脂性,所以Shh蛋白也能够附着在细胞膜上,通过反复地附着-解离在细胞之间运动。
当Shh分子到达细胞表面时,它能够与一个叫“补片蛋白”(Patched,简称PTCH)的受体结合,抑制它的功能。在没有Shh分子存在时,PTCH有一个作用,就是不断地把膜上的另一个蛋白分子Smoothened(简称SMO)上的“氧化胆固醇”(oxysterol)分子除去。由于SMO需要结合氧化胆固醇分子才有活性,在没有Shh结合到PTCH上时,SMO的活性是被PTCH蛋白抑制的。Shh与PTCH的结合解除了PTCH对SMO的抑制,让它和细胞内的下游分子相互作用。
在果蝇中,SMO的下游分子是一个转录因子,叫做“Ci蛋白”,是Cubitusinterruptus的简称。在SMO被抑制的状况下,Ci蛋白被“蛋白酶体”(proteosome)切断,从155kDa全长的分子中产生一个75kDa长的片段,叫做CiR。CiR能够进入细胞核,抑制基因的转录。在SMO被活化的状况下,Ci蛋白的降解被抑制,CiR浓度下降,全长的Ci蛋白浓度上升。Ci蛋白进入细胞核,活化基因的表达,因此Shh蛋白能够把Ci蛋白从转录抑制分子转变为转录活化分子,从而改变受影响的细胞的状态。
在哺乳动物中,SMO蛋白在细胞内的下游分子叫做“Gli”,因为该蛋白的基因是最先从“神经胶质瘤”(glioma)中发现的。和Ci蛋白一样,Gli蛋白也是一种转录因子,能够控制基因的表达。在SMO被抑制的情况下(即没有Shh信号的情况下),Gli蛋白也是被“蛋白酶体”切断,其羧基端进入细胞核,抑制基因的表达。而在SMO被活化的情况下,Gli被切断的通路被阻断,导致全长Gli分子的浓度上升,并且以全长状态进入细胞核,启动一些基因的表达。因此,从果蝇到哺乳动物,刺猬蛋白是通过同样的机制影响细胞的命运的,即都是通过解除对SMO的抑制,再通过Ci/Gli转录因子影响基因的表达,从而控制细胞的命运。
不仅如此,全长的Gli蛋白还能够增加PTCH基因的表达,由于PTCH对SMO的抑制会导致Gli蛋白被切断,这就构成了一个负反馈回路。Shh结合到PTCH上后,细胞还会通过“胞饮作用”(endocytosis)把Shh连同受体PTCH一起“吞”到细胞内,减少细胞外Shh的浓度,降低Shh对细胞的影响,构成另一个负反馈回路。这些回路在Shh分子发挥结构形成的功能上也起重要的作用。
在果蝇中,一个细胞分泌的“刺猬蛋白”Hh能够和相邻细胞上的PTCH受体结合,使得相邻的细胞分泌Wnt蛋白。分泌出来的Wnt蛋白又能够反过来通过“卷曲蛋白”和“蓬乱蛋白”作用于分泌刺猬蛋白的基因,稳定这两个细胞之间的关系。因此,刺猬蛋白信号通路和Wnt信号通路可以相互作用,共同导致生物体中结构的形成。
成纤维细胞生长因子FGF 1973年,美国科学家Hugo A.Armelin在脑垂体提取液中发现了一种因子,能够促使小鼠成纤维细胞(NIH 3T3细胞)分裂增殖。这种因子分子量大,不能通过透析除去,对热和蛋白酶敏感,说明它是一种蛋白质。Armelin把这种蛋白质叫做“成纤维细胞生长因子”(FibroblastGrowth Factor,简称FGF)。除了促进细胞增殖,它们还能够诱导上皮细胞形成管状结构,因此在血管生成上起重要作用。在胚胎发育过程中,它们诱导中胚层(mesoderm)的发生、前后端的结构形成、肢体发育和神经系统的发育。在成体动物中,它们在血管生成、伤口愈合和内分泌信号传递上都起重要作用。人类有22种FGF分子。 和Wnt蛋白、刺猬蛋白Hh一样,FGF蛋白也是细胞分泌到细胞外的信号分子,通过结合到细胞表面的受体分子上起作用。和上面几种蛋白不同的是,FGF蛋白除了与受体蛋白结合外,还结合细胞表面“硫酸乙酰肝素”(Heparansulfate,简称HS,是一种与肝素类似的多糖分子),因此对细胞膜也有一定的亲和力。
FGF的受体(FGFR)有四种,都是含有单个跨膜区段的膜蛋白。其中细胞外的区段负责与FGF分子结合,同时协助FGF分子与硫酸乙酰肝素分子结合。受体细胞内的区段具有酪氨酸蛋白激酶的活性,可以使细胞内的下游分子磷酸化,把信号传递下去。每种受体可以与一组特定的FGF分子结合,多数FGF分子也可以和几种受体分子结合,但是要传递信号,必须是两个相同的FGF分子与两个相同的受体分子结合,形成四聚体。四聚体的形成使受体的酪氨酸激酶的活性被激活,再通过下游分子的磷酸化把信息传递下去。
与多数生长因子受体一样,FGFR都是酪氨酸激酶型受体。酪氨酸激酶能够使蛋白分子中的酪氨酸残基被磷酸化,改变蛋白的性质。其中一些被磷酸化的蛋白本身也是酪氨酸激酶,又能够使更下游的蛋白质磷酸化,是动物细胞中传递信息的重要方式。例如FGFR在与FGF结合而被活化后,就能够活化磷脂酶-g(Plcg),生成“磷脂酰肌醇-3,4,5-三磷酸” PIP3,并且通过蛋白激酶C(PKC)、c-Jun氨基末端激酶(c-Jun N-terminal kinase, 简称JNK)、丝裂原活化蛋白激酶(mitogen-activated proteinkinase,简称MAPK)、细胞外调节蛋白激酶(extracellular regulated protein kinases,简称ERK)等多条途径影响基因表达。
骨形态发生蛋白BMP
1965年,美国的整形外科专家Marshall R.Urist发现,用酸除去骨里面的钙质,再植入兔的体内,可以诱导新骨的生成,他把里面负责诱导骨生成的因子叫做“骨形态发生蛋白”(Bone Morphogenic Protein,简称BMP)。随后的研究发现,BMP是“转化生长因子-b”(Transforming growth factor-b,简称TGF-b)超级家族的成员,是一种非常重要的形态发生蛋白,在身体各部分结构的形成中起不可缺少的作用。
BMP在细胞中也先是合成其前体蛋白,随后羧基端100-125氨基酸的部分被水解出来,形成二聚体,被分泌到细胞外作为诱导信号分子,所以BMP和Wnt蛋白、刺猬蛋白(如Shh)和FGF蛋白类似,也是通过在细胞外移动来传达信息的分子。BMP可以使间充质细胞变成骨细胞和软骨细胞,在动物肢体形成上起关键作用(见此文的第二部分,《我们的五根手指头是如何长出来的?》)。它也可以使“生肾芽基”中的间充质细胞发生间充质细胞-上皮细胞的转化,这样形成的上皮细胞后来形成肾小球和肾小管,并且通过抑制肾脏中上皮细胞-间充质细胞的转化,维持肾脏结构的稳定性。在斑马鱼(zebra fish)中,BMP的表达促使腹面结构的形成,而它在背面的活性被抑制,导致背面结构的形成,所以BMP在背-腹轴的形成中起关键作用。如果让所有细胞都表达BMP,那就只有腹面结构能够形成;如果用截短的BMP来对抗全长BMP的作用,斑马鱼就只形成背面结构。这些事实都表明BMP蛋白在生物体结构形成中的重要作用。
细胞表面有两类BMP受体分子,类型I和类型II。它们除了能够和BMP蛋白结合外,还有丝氨酸/苏氨酸蛋白激酶的活性,能够在其他蛋白分子中的丝氨酸或苏氨酸残基上加上磷酸基团。由于BMP分子形成二聚体,和它结合的受体也是二聚体。类型I和类型II受体和BMP的结合会导致两类受体形成四聚体(包含两个I型受体和两个II型受体)。II型受体会使四聚体中的I型受体磷酸化,使I型受体活化。活化的I型受体又会使细胞内的下游分子磷酸化,活化这些分子,使信号传递下去。
细胞内传递BMP信号的分子叫做SMAD,由果蝇中MAD(mother against decapentaplegic)和线虫中同源分子SMA(small body size)两个名称合并而成。SMAD蛋白分为三类。一类是从BMP受体处接收信号的,叫做R-SMAD(其中的R表示Receptor),包括SMAD1、SMAD2、SMAD3、SMAD5和SMAD8/9。第二类是起协助作用的,叫做co-SMAD(其中co表示common-mediator),只有SMAD4一种。第三类是起抑制作用的,叫做I-SMAD(其中I表示inhibitory),包括SMAD6和SMAD7。它们能够抑制前两类SMAD蛋白的作用。在BMP结合到I和II型受体上,活化类型I受体时,R-SMAD中的SMAD1和SMAD5被磷酸化而被活化。活化的SMAD1和SMAD5再和SMAD4形成三聚物,在细胞核中起转录因子的作用,调控基因表达。
控制左右不对称的蛋白——Lefty和Nodal
动物的身体分为左右两半,而且是不完全对称的。例如人的心脏位于身体的左边,肝脏位于右边。肺脏虽然胸腔的左右两边都有,但是肺叶数也不同(右边三叶,左边两叶)。控制动物身体左右不同发育的分子被认为也是被分泌的信号分子,但是在长时期中具体的分子一直没有被确定。
1996年,日本科学家滨田宏(Hiroshi Hamada)的实验室发现了小鼠胚胎中决定左右的分子,它在原肠胚形成过程中只位于胚胎的左边,因而被命名为Lefty。同BMP蛋白一样,Lefty蛋白也是“转化生长因子-b”(TGF-b)超级家族的成员,而且也是先被合成为前体分子,被蛋白酶加工切短以后再被分泌到细胞外,成为可扩散的信号分子。
Lefty的主要功能是对抗另一个扩散蛋白——Nodal的功能。Nodal也是“转化生长因子-b”(TGF-b)超级家族的成员,而且也是先被合成为前体分子。与Lefty不同的是,Nodal前体分子是在被分泌到细胞之外以后,才被一个叫做“转换酶”(Convertase)的蛋白酶切短,成为成熟的信号分子的。在动物的胚胎早期发育中,Nodal信号对于内胚层(endoderm)和中胚层(mesoderm)的形成,以及随后身体左右轴的形成都起重要作用。Lefty的合成需要Nodal蛋白的合成,Lefty蛋白又反过来抑制Nodal的活性,组成一个负反馈系统。
Nodal蛋白质与细胞上的受体结合,这些受体具有丝氨酸/苏氨酸激酶活性,可以使下游的蛋白信号分子被磷酸化。同BMP蛋白类似,Nodal的下游分子也是Smad蛋白。不过BMP磷酸化的是Smad1和Smad5,被磷酸化的Smad1和Smad5再和Smad4结合,进入细胞核调节基因表达;而Nodal受体分子磷酸化的是Smad2和Smad3,被磷酸化的Smad2和Smad3再和Smad4结合,进入细胞核,在那里它们再分别与p53、Mixer、FoxH1等蛋白质结合,与不同的基因启动子相互作用,调控这些基因的表达。 虽然Nodal和BMP都属于“转化生长因子-b”(TGF-b)家族的成员,下游的分子也都是Smad蛋白,但是它们的功能有所区别。BMP3和BMP7还能和细胞外的Nodal蛋白结合,彼此抑制对方的功能。
视黄酸RA
在控制动物结构形成的分泌分子中,视黄酸(Retinoic acid,简称RA)是一种非蛋白分子,从节索动物到脊椎动物,都需要它的诱导来形成身体中组织和器官。在动物早期的胚胎发育中,从身体特定区域分泌的RA能够在细胞和组织中扩散,形成RA的浓度梯度,使细胞能够根据这个梯度来获知自己在动物体内的位置,决定身体前后轴方向的结构形成。
RA由维生素A(即视黄醇retinol)经过两步氧化而成。第一步由RA脱氢酶催化,形成视黄醛(retinaldehyde),这是视网膜中感知光线的分子。视黄醛再经视黄醛脱氢酶催化,形成视黄酸RA。 RA是水溶性分子,能够比较自由地在细胞之间扩散,并且能够进入细胞,所以RA的受体不在细胞表面上,而是在细胞质中。RA的受体叫RAR,在结合RA后,RAR再和RXR(retinoid X receptor)结合,形成二聚体。这个RAR/RXR二聚体能够结合到DNA分子上的“RA反应序列”上,影响基因的表达。
小结
Wnt 蛋白、刺猬蛋白Hedgehog及其在哺乳动物中的同源蛋白音刺猬蛋白Shh、成纤维细胞生长因子FGF、骨形态蛋白BMP、以及非蛋白分子的视黄酸RA,都是由细胞分泌到细胞外,通过扩散影响其它细胞命运的的分子。它们和细胞上或细胞内的受体结合,触发信号传递链,最后在细胞核中影响细胞基因表达的状况,改变细胞的命运,即改变细胞的类型。细胞改变类型后,极性和表面蛋白的表达和分布状态也会改变,从而形成各种空间结构。这些扩散分子并不直接控制结构的形成,而是通过改变细胞的类型,让新形成的细胞“自行”组织成各种结构。
第三节 执行扩散信号分子命令的“专业户”基因——Hox和Pax基因
靠扩散来影响其它细胞的命运的分子,可以在远距离(即多个细胞的距离)上决定细胞的命运,从而在器官的尺寸水平上形成各种组织和结构。但是在形成各种器官时,还需要具体负责“建造工程”的基因。例如果蝇的身体外部就有口器、眼、触角、腿、翅膀等结构,要靠扩散分子来直接控制这些结构的形成,“线条”还太“粗”。这就像城市管理机构可以决定在哪里修建机场,在哪里建购物中心,在哪里建公园,但是具体建造这些场所还需要具体的“专业户”。他们各司其责,建机场的不负责建购物中心,建购物中心的不管建公园。在果蝇身体中,就有这样的“专业户”,有的负责触角的生成,有的复杂眼睛的生成,有的负责腿的生成。它们从扩散分子接到指令,动员下游的有关基因,具体去完成各种结构的建造。
这样的“专业户基因”有多种,其中一种就是“同源异形基因”(homeotic gene)。在这里homeotic的意思是如果这种基因发生突变,原先负责建造的结构就会变成另外一种结构,例如pb基因的突变会使原来应该长口器的地方长出腿来。另外一种叫做“Paired Box基因”,简称Pax基因,是与同源异形基因关系密切的基因。它们在生物结构中也起重要作用,例如Pax3的突变会造成耳聋,Pax6的突变会使眼睛不能正常形成,Pax2基因突变影响肾脏的正常形成等。
果蝇的Hox基因 同源异形基因也是发现“刺猬蛋白”(Hedgehog protein)的德国科学家Christiane Nüsslein-Volhard和EricWieschaus用突变剂“乙基甲磺酸脂”(EMS)对果蝇进行“饱和突变”时发现的。随后,美国科学家Edward B. Lewis具体研究了这些基因在果蝇胚胎发育中的作用,即发现了果蝇中具体实现结构形成的“专业户”。
对这些基因的研究发现,这些基因的蛋白产物都是转录因子,而不再是分泌到细胞外,通过在细胞之间扩散来发挥作用的分子。它们位于细胞内,管理为形成某个结构所需要的全部基因。例如果蝇的Antennapedia基因(简称Antp基因)是负责“包工”果蝇腿的形成的,这个基因的蛋白产物就可以调动为腿的形成所需要的全部基因。只要这个基因被表达,在表达基因的地方就会长出腿来,而不管是在身体的什么地方。例如果蝇头部的Antp基因被活化,在原来该长触角的地方就会长出腿来。所以这些基因相当于是“包工队”的“队长”,它根据自己的任务动员所需要的人员和设备来完成特定的建造工作。 这些“包工队”的“队长”也不是只做一种工作,这就要看在具体的生物中下游基因是什么。例如Ubx基因在果蝇中是控制平衡杆(Halteres)的生成,而在蝴蝶中是控制后翅的形成。这就像包工队的队长不是只会盖一种楼,而是可以盖彼此有相似性的楼一样。
这些基因还可以相互作用,例如Ubx基因的产物就可以结合在Antp基因的启动子上,抑制Antp基因的表达。在Ubx基因被活化的地方,Antp基因就不能起作用。这样,就不会出现数个专业户因为争夺工程而互相“打架”的情形。
果蝇的同源异形基因都位于第3染色体上,分为两群,分别是“双胸复合群”(Bithorax comlex,简称BX-C),和“触角复合群”(Antennapedia Complex,简称ANT-C),这两个homeotic基因群统称HOM-C。 对这些基因的DNA序列分析发现,每个基因都含有一个高度保守的,由180个碱基对组成的区段,为60个氨基酸编码。由这些氨基酸组成的肽链段负责和下游基因调控部位的DNA序列结合,而且各种同源异形基因的这段DNA序列高度相似,被统称为“同源异形盒”(Homeobox),这些基因也就在英文中被称为Homeobox基因,简称Hox基因。
既然不同的Hox基因的同源异形盒都高度相似,下游基因又如何区分这些基因,从而决定哪些Hox基因管控哪些下游基因呢?这就是盒子中第9位的氨基酸的作用。所有的同源异形盒都能够结合到下游基因调控部位的TAAT序列上,但是区分不同盒子的是DNA序列在这个TAAT序列旁边的核苷酸。例如果蝇的Antp基因的盒子在第9位上的氨基酸是“谷氨酰胺”,结合到TAAT序列旁边的腺嘌呤(A)上。而果蝇的Bicoid蛋白中,第9位的氨基酸是赖氨酸,结合到TAAT序列旁边的鸟便嘌呤(G)上。如果把Bicoid蛋白中的赖氨酸换成谷氨酰胺,它就会结合到Antp控制的基因上。通过这种方式,不同的Hox基因就可以特异地控制自己的下游基因,它们的作用就不会彼此混淆了。
Hox基因在果蝇第3号染色体上的排列方式也很有趣,即它们在染色体中的排列顺序和它们在果蝇身体上表达部位的空间顺序一致。位于DNA 3’端的Hox基因表达在果蝇身体的头部,而位于DNA 5’ 端的Hox基因表达在果蝇身体的尾部,位于这两端之间的Hox基因也按照它们在DNA中的顺序在身体中依次排列,这个现象叫做“同线性”(Co-linearity)。为何Hox基因在DNA上排列的顺序和它们在身体中表达的空间顺序相同,一直是使发育生物学家感到困惑的问题。控制性别的基因中,位于上游和下游的基因在DNA上就不按什么顺序排列,甚至可以不在同一条染色体上。Hox基因的同线性也许是这些基因需要排列在一起,以受一些共同的机制调控。
哺乳动物的Hox基因
由于180个碱基对的DNA序列(同源异形盒)在Hox基因中是高度保守的,用这部分DNA序列来和哺乳动物的DNA杂交,就可以找出哺乳动物中类似的基因。用这种方法,科学家在哺乳动物如小鼠(mouse)和人身上也发现了Hox基因。如果把果蝇的“双胸复合群”和“触角复合群”(称HOM-C)总共算做一组,那么哺乳动物中就有四组,分别叫做A、B、C、D,每一组里面有13个Hox基因的位置,其中一些和果蝇HOM-C中的Hox基因对应,因此哺乳动物有四套Hox基因。这四组Hox基因位于不同的染色体上,例如在小鼠中,它们分别位于第6、11、15、2号染色体上,在人体中这四组Hox基因则分别位于第7、17、12、2号染色体上。人类的Hox基因全用大写英文字母,例如HOXB1表示B组Hox基因中的第1号基因。小鼠的Hox基因则只第一个字母大写,例如Hoxa10表示小鼠a组Hox基因中的第10个。
如果把果蝇HOM-C中Hox基因的排列顺序和哺乳动物每组中Hox基因的排列顺序相比较,就会发现对应基因的排列顺序是一致的,即在进化过程中保留不变。例如果蝇中 Dfd-Scr-Antp-Ubx-abdA-abdB 的排列顺序,就和人对应的 HoxB4-HoxB5-HoxB6-HoxB7-HoxB8-HoxB9 基因的排列顺序一致。其中人的HOXB4就相当于果蝇的Dfd,人的HOXB7就相当于果蝇的Ubx,等等。不同组中号码相同的Hox基因功能相似,叫做“平行同源家族”(paralogs)。例如小鼠的Hoxa3、Hoxb3、Hoxd3都和颈部脊椎骨的形成有关。多个平行同源家族的基因由于功能相似,相当于具有备份,这样一个基因的突变就不容易造成重大的恶果。例如Hoxa11和Hoxd11都和手臂中的桡骨(radius)和尺骨(ulna)的形成有关。突变Hoxa11基因或者突变Hoxd11基因都只能对桡骨和尺骨的形成造成轻微缺陷,只有这两个基因同时突变才会使桡骨和尺骨无法形成。不同动物中同号的基因功能也相似。例如鸡的Hox基因就能取代果蝇的对应基因。但是同组中相邻的Hox基因功能却彼此不同。例如Hoxa11的功能就不能由Hoxa3基因取代。
在哺乳动物中,身体的发展和调节更为复杂,Hox基因不仅在胚胎发育中起作用,也在成年动物身上起作用,例如在血细胞的分化上,这就和Hox基因在结构上的作用无关了。反过来,身体里面一些结构的发育也不完全由Hox基因控制。例如在动物眼睛的发育中,Pax6 基因就起关键作用,敲除小鼠的Pax6基因,眼睛就不能形成。而且Pax6基因的作用是高度保守的,小鼠的Pax6基因甚至能够在果蝇中诱导眼睛的生成。所以在前面我们说Hox基因是“包工队”的“队长”,只是一个简化的比喻,Hox基因的工作方式是非常复杂的。
许多Hox基因受上游基因的控制,特别是我们前面讲到的成纤维细胞生长因子FGF和视黄酸RA。它们位于发育中的胚胎的两端,分别控制一些Hox基因。FGF主要控制DNA上5’端(对应于动物的尾端)的Hox基因,而DNA上3’端(对应于动物首端)的Hox基因主要为RA所控制。
水螅和酵母就有Hox基因
科学家在果蝇中发现Hox基因后,人们一度以为Hox基因只存在于两侧对称生物中(bilaterals),因为这些生物才有前后轴和背腹轴。然而在刺细胞动物(Cnidaria)如水螅(Hydra)中,科学家也克隆到了5个Hox基因,并且测定了其中两个的DNA序列(分别叫做Cnox-2和Cnox-3)。虽然水螅的身体像一根空管,是辐射对称的,Hox基因在水螅中被发现说明Hox基因很早就开始扮演结构形成的角色。Cnox-3主要集中在水螅身体的上1/8部分,在身体和触角的交界处,也在出芽水螅的顶端。如果水螅从中间切断,下半截朝上的部分(即原来的嘴的方向,也可以看出水螅的“头”的方向)就会表达比较高的Cnox-3,促使水螅长出新的“头”。而Cnox-2主要表达在身体的其余部分,而在水螅身体的上1/8部分很少表达,所以Cnox-2的作用可能是抑制“头”的生成。
从Cnox-2和Cnox-3蛋白的氨基酸序列来看,它们分别类似于小鼠的Hox-4和Hox-1,都是表达在靠身体靠前部的基因。如果把水螅的“头部”看成“前端”,而Cnox-3的表达位置比Cnox-2更靠前端,这说明水螅的Hox基因就已经根据身体的前后位置来表达了。也就是说,在两侧对称动物出现之前,Hox基因就已经在动物身体的发育上起作用了。这些事实说明,Hox基因组也许最先是由一个Hox基因经过复制然后分化形成的,而在哺乳动物中又整组Hox基因被复制。
Hox基因的出现甚至可以追溯到水螅之前,例如Hox基因在单细胞的裂殖酵母(Schizosaccharomycespombe)中就已经有了。它含有一个同源异形盒,被称为“裂殖酵母的Hox基因”(Pombe Homeobox),简称Phx1基因,说明Hox基因有非常久远的历史。目前测到的Phx1基因的功能是增加丙酮酸脱羧酶的合成,把原来用于三羧酸循环原料的丙酮酸变成乙醛,再变为乙醇,即对有机分子进行无氧代谢,增强酵母菌在生长停滞期和营养缺乏时生存的能力。Phx1是如何在多细胞动物中变为控制结构形成的基因的,或者哪一个单细胞生物的Hox基因后来演变为动物的Hox基因,是一个有趣的问题。
Pax基因家族
除了Hox基因,另一组基因,叫做Pax基因的,也在动物身体的结构形成上起重要的作用。它们含有部分的或者整个的同源异形盒(Homeobox),因此和Hox基因家族关系密切,可以看成是Hox基因的“亲戚”。和Hox相同的是,Pax基因也是转录因子,通过结合在基因的调控序列上影响基因的表达。和Hox基因不同的是,Hox蛋白只有一个DNA结合区段(即同源异形盒),而Pax蛋白有两个DNA结合区段,一个是同源异形盒,叫“同源异形区段”(Homeodomain,简称HD)。另一个叫“配对区段”(Paired domain,简称PD)。由于这些基因的产物有两个(成对的)DNA结合区段,这些基因也因此叫做“成对区段基因”(Paired Box)基因,简称Pax基因。Pax基因用这两个DNA结合区段分别执行不同的任务。例如Pax6蛋白用HD来控制眼睛的发育(包括晶状体和视网膜),而用PD来控制神经系统的发育。
像Hox基因家族一样,Pax基因家族也有多个成员,分别执行不同的功能。
在小鼠中,Pax1基因控制脊柱的发育和身体分为节段。估计在人体中也有类似功能。Pax1蛋白由440个氨基酸残基组成。
Pax2有417个氨基酸单位,主要控制肾脏的形成,Pax2基因的突变会造成肾功能缺失或者肾肿瘤的发生。
Pax3和耳朵、眼睛和面部的发育有关,有479个氨基酸单位。Pax3基因突变会导致耳聋。
Pax4基因和胰腺中分泌胰岛素的b细胞的形成有关,有350个氨基酸单位。
Pax5基因和神经系统发育和生精过程有关,和免疫系统中B细胞的分化也有关系。它有391个氨基酸单位。
Pax6基因是控制眼发育的关键基因,也和其它感觉器官(例如嗅觉)的发育有关。
Pax7基因和肌肉的发育有关,有520个氨基酸单位。
Pax8基因和甲状腺的发育有关,有451个氨基酸单位。
Pax9基因和骨骼牙齿的发育有关,有341个氨基酸单位。
从Pax基因以上的功能看出,Pax基因,同Hox基因一样,也是具体指导各种组织和器官形成的“专业户”。它们从扩散因子中获得指令,在具体的组织和器官中发挥作用。扩散因子正是通过这些“专业户”来具体形成各种组织和器官的。
以上的介绍说明,生物体从一个细胞(分生孢子或者受精卵)发育成为具有复杂结构的生物体,不是依靠DNA直接的结构指令(这些直接的结构指令也并不存在),而是依靠胚胎发育过程中一些细胞或细胞团分泌的扩散性分子控制大范围内其它细胞的命运,使它们向不同的细胞类型方向发展。这些扩散性分子通过具体的“专业户”(例如Hox基因和Pax基因)来具体动员形成一个结构的基因。这些基因再控制下游基因的表达,使细胞产生极性,再通过细胞-细胞之间的直接接触,同类细胞聚集在一起,成为片状或管状的结构,而不同类型的细胞则通过表面结合分子的差别彼此隔离,形成边界,最后导致各种结构的形成。也就是说,生物是通过若干总数不多的成型分子在不同发育阶段、分层次的调控来实现身体的发育过程的。
这是一个动态,多步骤的过程,每一步都会有新类型的细胞产生,而一些新形成的细胞又会通过分泌扩散性分子影像周围细胞的命运。每一步都在前一步的基础上活化新的基因,形成新的细胞和结构。虽然DNA并不含有形成生物结构的直接指令,但是通过多个步骤和层次控制这些基因的有序表达,却可以一步一步发展出各种复杂的结构,最后形成完美的生物体,实现DNA的“蓝图”功能。这真是一个奇迹。看看同窝蚂蚁彼此之间高度的相似性,看看人体结构在世界范围内不同人种之间高度的一致性,就可以体会到生物的成型系统是多么精妙。在随后的文章中,我们将用一些生物结构的形成过程为例,来具体地了解这个系统是如何工作的。
主要参考文献
1,LecuitT, “Developmental mechanics:cellularpatterns controlled by adhesion, cortical tension and cell division. HFSPJournal, 2008, 2(2):72-78.
2,BeloussovLV, Grabovsky VI, Morphomechanics: goals, basic experiments and models.International Journal of Developmental Biology, 2006, 50(2-3):81-92
3,HazenRM, The emergence of patterning in life’s origin and evolution. InternationalJournal of Developmental Biology, 2009, 53(5-6):683-692.
4,NewmanSA, Bhat R, Dynamic patterning modules: a pattern language for development andevolution of multicellular form. International Journal of DevelopmentalBiology, 2009, 53(5-6):693-705.
http://blog.sciencenet.cn/blog-582158-889920.html 此文来自科学网朱钦士博客,转载请注明出处。
上一篇:为什么地球上的生物使用左旋的氨基酸和右旋的糖分子?
下一篇:怎样理解“DNA”是生命的蓝图这句话?(二)
19 许培扬 郑小康 袁海涛 张磊 王荣林 张重义 王天燕 赵鹏 李久煊 陈新 胡洪涛 王志平 杨洪强 苏晓路 zhoutong peosim hnw48 zhucele xuexiyanjiu
该博文允许注册用户评论 请点击登录 评论 (12 个评论)
- [12]苏晓路
- 很像软件中子程序相互调用的结构,各种调用关系复杂纠缠,交织成网状结构,而不是清晰的层次结构。上帝不是个好程序员,从来不做重构。
- 博主回复(2015-5-16 09:51):你的这个比喻很好,生物结构的依次出现和子程序的调用过程的确非常相似。不同的是生物结构的形成过程是自然形成的,只能在已有的基础上加以修改,而不能推到重来。而计算机程序是人写的,也可以根据需要任意改变。
- [11]万君兴
- 好文章
- 博主回复(2015-5-15 12:26):谢谢。
- [10]王志平
- 首先要思考,一级序列是怎么来的? 核心在于三维立体结构。
- 博主回复(2015-5-15 12:26):最初的一级序列可以在受精卵阶段就从外部(例如从母体)得到,例如果蝇中的bicoid和nanos就是由母体的细胞注入受精卵的两端的。但是哺乳动物的受精卵可以通过细胞之间的相互作用让原来是一样的细胞向不同的方向转化,同时产生细胞极性,成为三维的结构。
- [9]lrx
- 我在8楼所说的压缩算法当然是指仿生物基因指挥形成细胞的压缩算法。
- [8]lrx
- 文章很长,看得有点累 还得再仔细看看。不过一开始看基因数目远小于细胞数目的那一点,我突发奇想:能不能设计一种压缩算法,把海量的原始信息(相当于记录了每一个细胞)压缩成一点点(相当于基因)呢?不过看到后面,觉得大概够戗。
- 博主回复(2015-5-15 12:21):我也觉得这不太可能。DNA里面的信息是通过一个极其复杂的调控网络实现的,目前还有大量的调控回路不为人知,而且在时间上是分阶段的。
- [7]xuexiyanjiu
- 系列科普——点赞。
- 博主回复(2015-5-15 12:18):谢谢。
- [6]zuobuli
- 功力深厚! 若能配上插图再在细节上扩展则很是不错的发育生物学教材。
- 博主回复(2015-5-15 12:18):谢谢鼓励。许多现成的图都有版权问题,所以我的文章一般都没有配图,而是尽量用文字说明,读起来肯定不如有图示的文章方便。抱歉!
- [5]吕秀齐
- 好长的博文啊,得有好几万字了吧,不知科学网发博文有没有字数限制呢。不过我准备粘贴下来好好学习一下。
- 博主回复(2015-5-15 12:14):抱歉。由于内容太多,又想尽量给大家一个比较完整的资料,不用事事都自己再去查,所以文章长了些。
- [4]赵鹏
- 感谢 娓娓道来 很清晰 有意思 感谢! 受教了
- 博主回复(2015-5-15 12:11):谢谢你的肯定。
- [3]杜敏彪
- 隐居欲就庐山远,
丽藻初逢休上人。
数问舟航留制作,
长开箧笥拟心神。
沙村白雪仍含冻,
江县红梅已放春。
先蹋炉峰置兰若,
徐飞锡杖出风尘。
《留别公安太易沙门》是唐代著名诗人杜甫所作的一首古诗。此诗当作于公元768年(唐代宗大历三年),当时杜甫57岁,在公安(今湖北省公安县)。
这首七律的用韵方式是首句不入韵平起式。其韵脚是:人神春尘。韵部均为:上平十一真(平水韵)。 - 博主回复(2015-5-15 12:10):佩服你的文学功底。
- [2]王皓
- 呵呵,这个要好好看看,学习一下。第一段:雨燕的翅膀使它能够以每小时350公里。。。这个不准确吧,Golden eagle= 320 km/h, peregrine falcon = 389 km/h, swift= 171km/h.
- 博主回复(2015-5-15 12:09):谢谢你提供的数据。每小时300多公里已经比在高速公路上开车快许多了。
- [1]袁海涛
- 好文章 谢谢朱老师
- 博主回复(2015-5-15 12:07):谢谢你和大家的鼓励和支持
微分几何科普(1):浅谈度规和曲率
论坛嘉宾: 萍踪浪迹 gauge 季候风 |
萍踪浪迹 发表文章数: 1051 内力值: 453/453 贡献度: 9137 人气: 1200 |
微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
微分几何科普(1):浅谈度规和曲率
Shanqin(萍踪浪迹) 前言:从现在开始,写一些大学理科生可以轻松看得懂的科普帖子,作出的牺牲就是让其他更高学历的人看起来很平庸.从现在开始,要把看起来要写比较长的文章分开写,不在一个帖子里搞连载。这样主要是为了避免没有时间续写自己的主题而让自己的帖子变成TJ帖(啥叫TJ呢?就是和DJ有一定联系的……)。 正文:初步的微分几何,必须掌握基本的曲线论,必须适应以弧长为参数的方程.Frenet公式是曲线论基本公式, Frenet标架是活动标架在曲线时的特殊情形.两条曲率和挠率都一样的曲线可以通过刚体运动重合在一起,这是曲线论基本定理.曲线的内蕴曲率为零。所以所有曲线都可以拉直而不改变其上任意两点间弧长.我们知道,曲面论中这一点通常不能成立,除非此曲面可以等距映射为平面,我们称这种可以和平面进行等距映射的曲面为平坦曲面,如柱面. 因此,我们必须深入研究曲面的曲率问题,首先要熟悉曲线坐标,在切平面上讨论问题,这个是整个微分几何的基础.因为即使到高维情形,我们仍要讨论切空间及其上的Levi-Civita联络. 在切平面上任意点引入切矢量基(du,dv),切向量在这个基下的分量则为r_u,r_v,定义切向量内积系数: E=< r_u. r_u>=g_11, F=< r_u. r_v>=< r_v. r_u>=g_12, G=< r_v. r_v>=g_22, 这三个量就是极其重要的度量(度规)系数. 曲面的第一基本形式于是可以写成: Ⅰ=<dr.dr>=Edudu+2Fdudv+Gdvdv=g_ijdu_idu_j 最后一式我们将du,dv写成du_1,du_2,i,j取值为1,2,这里采用了Einstein求和约定:重复指标自动求和.这样的符号约定和求和约定可以让我们轻松将2维情形推广到n维流形的n维切空间,其上切向量内积系数(度量系数)就是g_ij(i,j=1,2,…,n),若n等于4,就是广义相对论中的度规张量情形. 我们开始讨论曲面的第二基本形式.引入曲面上任意点的法向量n,定义两点间法向量的变化: dn=n_udu+n_vdv. 其中n_u,n_v为dn在基(du,dv)下的展开系数.则我们可以定义内积: L=-< r_u. n_u>=h_11 M=-< r_u. n_v>=< r_v. n_u>h_12 N=-< r_v. n_v>=h_22 L,M,N(h_11, h_12, h_22)称为第二形式基本量,于是第二基本形式可以写成: Ⅱ= -<dr.dn>= Ldudu+2Mdudv+Ndvdv= h_ijdu_idu_j. 最后一个等式采用的符号和求和约定同上. 第一基本形式决定了曲面的内蕴结构,以后我们会发现,联络系数(Christoffel符号)由度规张量和度规张量的一次导数决定,而曲面的Gauss曲率(广而言之,流形的Riemann截面曲率)由联络系数及其一阶导数决定. 什么是Gauss曲率和Riemann截面曲率? 我们可以从曲面的法曲率出发,定义主曲率.我们想象拿着一把刀,贴着曲面上某点(u,v)的法线往下切,在曲面上切出一条曲线,这条曲线的曲率就是曲面在该点(u,v)沿(du,dv)方向的法曲率.如果想象我们切一个椭球面,在同一点贴着法线,沿不同方向切下去,切出的所有曲线(称为法截线,相应的这一刀所在的平面称为法截面)的曲率不一定一样.我们把这些曲线的曲率进行比较,最大和最小的法曲率称为主曲率,记为k_1, k_2.这两个法曲率对应的法截线必定垂直. 定义Gauss曲率为k_1, k_2的乘积:K= k_1.k_2. 若K=0,则曲面必然平坦. 定义平均曲率为k_1, k_2的算术平均: H=( k_1+_2)/2.若H=0,则该曲面就是极小曲面. Gauss绝妙定理指出, Gauss曲率K在曲面的等距变换下保持不变.即曲面的内蕴性质由第一基本形式决定决定,与它在外围空间中的形状无关.而曲面的第二基本形式则决定了曲面在外围空间中的形状.这些结论可以可以推广到高维空间中的超曲面(维数比外围空间低一的曲面称为超曲面). 1854年Riemann推广了Gauss的想法,将抽象曲面研究推广到高维抽象弯曲空间(流形)进行研究.在高维情形,我们将面对切空间.与前面类似,我们定义度规系数g_ij(i,j=1,2,…,n),此时我们可以让其他方向都退化,留下两个方向,用曲面论观点看问题.这样就可以将Gauss曲率搬到这里,由于方向很多,我们将面对不止一个的Gauss曲率,我们将这些曲率称为Riemann截面曲率.显然,当弯曲空间为2维曲面时, Riemann截面曲率就是Gauss曲率. Riemann截面曲率为常数的空间称为常曲率空间,如果这个常曲率空间是单连通的,我们就称为“空间形式”,最重要的三种空间形式分别是正曲率的球空间,零曲率的欧空间,负曲率的双曲空间. Riemann在世时,并未将这个想法进行详细发展,后世的Christoffel进行了很大的扩充,这个曲率由Christoffel符号的导数和乘积表示, 所以Riemann截面曲率也称为Riemann-Christoffel曲率. 将Riemann截面曲率缩并(取迹,即让R_ijkl中的两个字母相同而求和),就得到了Ricci曲率R_ij,将Ricci曲率缩并,就得到标量曲率(数量曲率,纯量曲率)R. 这些概念在后来Einstein创立的引力论(GR)之中都成为核心概念.GR确定了时空曲率和物质分布的关系.其基本方程就是Einstein方程: R_ij-1/2 R g_ij+Λg_ij=8πT_ij 其中R_ij为时空的Ricci曲率,R为时空的标量曲率, g_ij为时空的度规张量. Λ为宇宙学常数, T_ij为物质的物质的能-动张量.我们可以记G_ij=R_ij-1/2 R g_ij, G_ij就是通常所说的Einstein张量. 因此我们研究四维时空时,只要知道它的度规张量(第一基本形式系数),就可以直接以这个四维时空为研究对象,而不用考虑将这个时空嵌入更高维数的空间进行研究.所以不管是Minkowski空间,de Sitter空间还是反de Sitter空间,都是写成度规后进行研究. 但是在很多时候,我们要研究时空中的超曲面. 即使是de Sitter空间和反de Sitter空间,我们也可以将它们分别嵌入五维欧氏空间R^5里面的双曲面. 而在广义相对论中我们以Lorentz流形作为基本研究框架(尽管我们可以赋予时空其他形式的度规结构,但是我们最经常使用的还是Lorentz度规.)我们通常要研究Lorentz流形中的类空超曲面M^3,为了研究其上的内蕴特征和外在特征在时间演化下的变化,就必须引入初始数据集(M^3,g_ij, h_ij),此处g_ij, h_ij分别为M^3上的度规张量和第二基本形式量. g_ij和h_ij必须满足的相容性条件是著名的Gauss-Codazzi方程.因为 Gauss-Codazzi方程是(超)曲面存在的充分必要条件.因此可见看似初等的微分几何曲面论中的一些概念在广义相对论的现代研究中实际上是非常重要的.
漫漫长夜不知晓 日落云寒苦终宵
痴心未悟拈花笑 梦魂飞度同心桥
| ||
萍踪浪迹 发表文章数: 1051 内力值: 453/453 贡献度: 9137 人气: 1200 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
但是在很多时候,我们要研究时空中的超曲面. 即使是de Sitter空间和反de Sitter空间,我们也可以将它们分别嵌入五维欧氏空间R^5里面的双曲面.
=================================================== 昌海兄,请将上面这一段替换成下面这一段,然后删除此回帖: 但是在很多时候,我们要研究时空中的超曲面. 即使是de Sitter空间和反de Sitter空间,我们也可以将它们分别嵌入五维伪欧氏空间(pseudo-Euclidean spaces)R^5里面的双曲面。dS空间嵌入的是号差为(-,+,+,+,+)的伪欧氏空间,AdS空间嵌入的是号差为(-,-,+,+,+)的伪欧氏空间.另外,1933年时,Robertson证明了Einstein静态时空也可以嵌入号差为(-,+,+,+,+)的伪欧氏空间。
漫漫长夜不知晓 日落云寒苦终宵
痴心未悟拈花笑 梦魂飞度同心桥
| ||
卢昌海 发表文章数: 768 内力值: 416/416 贡献度: 7898 人气: 1737 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
这篇文章中由于有一些“<”符号, 在修改过程中会被系统错当成 HTML Tag, 因此只好不改了。 不过在文集版本中我会进行上述替换的。
宠辱不惊,看庭前花开花落
去留无意,望天空云卷云舒
| ||
Zhangshizhuo 发表文章数: 71 内力值: 132/132 贡献度: 674 人气: 55 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
dS空间嵌入的是号差为(-,+,+,+,+)的伪欧氏空间,AdS空间嵌入的是号差为(-,-,+,+,+)的伪欧氏空间.另外,1933年时,Robertson证明了Einstein静态时空也可以嵌入号差为(-,+,+,+,+)的伪欧氏空间。
================================================================================= (-,+,+,+,+)这个东西跟Crystal base and Quantum group有什么关系?
Sheaf and Scheme
有对称的地方就有群 有加法的地方就有同调代数
| ||
那一剑的寂寞 发表文章数: 193 内力值: 170/170 贡献度: 2297 人气: 332 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
萍踪兄,写的好,期待续集,先好好看看.微分几何一直是我的心病.
天下风云出我辈,一入江湖岁月催;
王图霸业谈笑中,不胜人生一场醉。
| ||
踏雪无痕 发表文章数: 12 内力值: 83/83 贡献度: 99 人气: 7 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
正在学习黎曼几何,感觉很是困难,
有高手能解释一下下面的问题吗, 张量的具体定义, 还有在流形上如何定义算子div f,还有梯度 f,其中f 是定义在流形上的光滑函数.
| ||
纳兰容若 发表文章数: 2 内力值: 64/64 贡献度: 40 人气: 32 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
萍踪兄倒是写了不少科普痕迹的文章,而且貌似牵涉到很多的方面。
随便问下,不知萍踪兄自己做国什么工作没有啊?
……
| ||
萍踪浪迹 发表文章数: 1051 内力值: 453/453 贡献度: 9137 人气: 1200 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
张量的定义要从切空间和余切空间开始,这在Riemann几何的很多书里都有,而流形上的算子其实也只是通常的欧空间里的算子的推广定义。只是比较抽象而已。
漫漫长夜不知晓 日落云寒苦终宵
痴心未悟拈花笑 梦魂飞度同心桥
| ||
踏雪无痕 发表文章数: 12 内力值: 83/83 贡献度: 99 人气: 7 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
萍踪兄是学数学的吗?
能具体的讲讲这些算子吗?
偏微分方程是刻画一组量之间的关系的,数学家研究其存在性,稳定性,唯一性,还有一个很重要的是,偏微分方程解的行为。
| ||
追忆 发表文章数: 195 内力值: 180/180 贡献度: 511 人气: 74 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
好久没来,又看见萍踪兄的好文章了.
萍踪兄写的好啊,我期待更好的.
非关癖爱轻模样,冷处偏佳,别有根芽,不是人间富贵花;
谢娘别后谁能惜,漂泊天涯,寒月悲笳,万里西风瀚海沙.
| ||
萍踪浪迹 发表文章数: 1051 内力值: 453/453 贡献度: 9137 人气: 1200 |
Re: 微分几何科普(1):浅谈度规和曲率 [文章类型: 原创]
踏雪无痕:关于张量的一些知识,请进入这个地址:http://www.changhai.org/bbs/collection/s14.php
追忆兄:谢谢
漫漫长夜不知晓 日落云寒苦终宵
痴心未悟拈花笑 梦魂飞度同心桥
|
No comments:
Post a Comment