蛋白质结构与功能中的位点氨基酸
研究简报
41
摘要 结合和催化是蛋白质重要的生物化学功能,蛋白质结构特异性识别其他分子是其功能的关键。结合位点和催化位点氨基酸是蛋白质行使功能关键位置上的结构体现。在复杂的蛋白质结构和功能研究中,位点氨基酸的组成、使用率等对挖掘分子结构功能关系具有重要作用。位点氨基酸层次的研究将会促进蛋白质与配体相互关系、蛋白质折叠机制和蛋白质设计的研究。
关键词 金属结合位点;催化位点;氨基酸;蛋白质结构与功能中图分类号 Q51
蛋白质结构与功能中的位点氨基酸
秦 涛
(山东理工大学生命科学学院,山东,淄博,255091)
1 引言
蛋白质是生命活动的重要物质基础,也是细胞中最具多功能的大分子,几乎一切生命现象都要通过蛋白质的结构和功能而体现出来,其生物化学功能的主要例子包括结合、催化、作为分子开关以及作为细胞和机体的结构组分[1]。蛋白质的结合功能(本文只研究金属结合蛋白)利用了蛋白质呈现的多种结构和表面的化学性质的不同,从而与金属进行高度特异性的结合;细胞中的化学反应基本上都是被催化的,大多数的催化剂是酶蛋白,酶的结构特性都服务于其催化力。催化不仅仅需要与底物或调节分子进行特异性的结合,还需要特异的化学反应性。蛋白质功能的多样性与构成它的氨基酸的化学性质的多样性以及具有不同氨基酸组成的多肽链多种多样的折叠方式十分的相关[1]。
基因上的DNA碱基顺序与它所编码的蛋白质的氨基酸顺序呈线性相关,同时氨基酸的化学性质对蛋白质折叠和功能也具有重要影响,遗传密码的构成也反应了氨基酸的化学分类,因此从氨基酸性质上研究蛋白质的功能(结合和催化)为深入研究蛋白质结构与功能提供了参考。
2 研究方法
2.1 数据来源
金属结合位点数据来自MetalMine [2] (29 Mar 2010),该数据库是金属离子结合蛋白的数据库,收录了cobalt、copper、iron、iron (sulfur)、iron(hem)、manganese、nickel、vanadium、
Tungsten以及zinc (in preparation)等十种结合金属,共487条记录,包含了171种酶以及SCOP[3 ]注释
的142个Folds,170个Superfamilies和266个Families。
酶的活性位点和催化残基数据来自酶催化位点数据库CSA [4] (Catalytic Site Atlas,20 Jan 2010),该数据库收录了两种类型的数据:从原始文献中提取的手工注释的PDB[5]记录以及在此基础上通过PSI-BLAST得到的同源蛋白的记录。为保证研究更加可信,我们选取了CSA数据库收录的968条文献记录的进行分析。2.2 数据处理
统计金属结合位点和催化位点氨基酸相关的酶和家族的数目,然后对研究的数据集中涉及的金属或酶和家族数比较多的氨基酸的分布进行统计;通过比较结合位点使用的氨基酸在不同金属之间和不同类酶中家族的使用率,结合氨基酸的性质和金属或酶中位点氨基酸的分布组成,分析位点氨基酸与蛋白质结构与功能的关系。
3 结果与讨论
3.1 金属结合位点
蛋白质中有很多的氨基酸残基,其中能起配位作用的基团只有处于有利位置的并具有较强的配位能力时,它们对金属离子的配位作用才占主导地位[6]。对MetalMine收录的487条记录进行分析,统计金属结合位点的氨基酸涉及到的酶和家族的数目(Fig. S1),结果表明,His充当了100多种酶和160多个家族中金属结合位点的角色,涵盖50种以上酶和家族的氨基酸还有Cys,Asp和Glu。
由金属离子决定的生物学过程遍及整个生命科学,与蛋白质结合的金属往往有以下作用:在结构的形成和裂解中起作用,包括充当模板,对蛋白质结构起稳定作用;在激发和调控中作为激发剂或控
生命科学仪器 2011 第9卷/4月刊
研究简报
42
吸、肌肉收缩)以及氧合作用。Co存在与维生素B12中,这是Co唯一具有明白的生物学功能的位点。Ni是水解酶(脲酶)氢化酶、CO脱氢酶、S-甲基CoM还原酶的组分之一,所有已知的Ni均来自植物和细菌。Mn在光合中心所催化的释氧过程中其关键作用,细菌线粒体中的超氧化物歧化酶,以及哺乳动物体重的丙酮酸羟化酶也是锰蛋白[6]。
3.2 催化位点
对CSA数据库收录的968条文献记录进行分析,统计氨基酸作为催化位点涉及到的酶和家族的数目(Fig. S3)。显而易见,Asp和His在300多种酶中都充当了催化位点的角色,100种酶以上的氨基酸有Asp,His,Glu,Lys,Arg,Tyr,Ser和Cys。而氨基酸在家族中分布,His 和Asp在250多个家族中分布最广,其次是Glu,Arg,Lys,Tyr,Ser和Cys等。
100种酶以上的氨基酸残基以及家族分布中大多为亲水性的,如Asp,His,Glu,Arg,Ser和Cys,只有Lys和Tyr是两亲性的。Asp,His,Glu在20种氨基酸在酶的催化位点中出现最多,Asp和Glu在PH=7时通常去质子化并带负电荷,但在蛋白质内部疏水环境中,pKa可能变化到7或者更高,这样在生理PH条件下就可作为质子供体起作用。His它具有两个可被
制剂;起路易斯酸的作用;作为氧化还原催化剂参与反应过程。生物必需元素中金属有Na、K、Ca、Mg、Mn、Fe、Co、Cu、Zn、Mo,其中Na、K、Ca、Mg属于主量金属[6]。在MetalMine数据库中,金属离子与结合位点氨基酸存在一定的关系(Fig. 1和Fig. 2a)。对Cu、Fe(Hem)、Fe、Co、Ni而言,在蛋白质中结合位点上His居多(约75%~90%);Mn在蛋白质中结合位点氨基酸70%多的是Asp,而Fe(S)结合位点氨基酸全是Cys。
Cu2+优先采取的配位基团是羧基和咪唑,与His的累积稳定常数的对数值(log βi)为18.3,吸收因子(log βi [Mn+])为4.3[6],相比其他氨基酸,Cu2+优先选择的是His。与氨基酸中咪唑基团配位的金属离子有Cu +、Cu 2+、Fe 3+、Co2+、Ni2+、Mn2+[6],这些金属离子与His都有很强的配位能力,Mn2+ 和Mn3+优先采取的共同配位基团是羧基和磷酸基,在20中氨基酸中,Asp和Glu都有两个羧基,与Mn也有很强的配位能力。因此在Fig. 1中所示,Asp、His和Glu都有50%以上的家族结合了金属Mn。
Cu参与多种生物学反应:氧分子的可逆性结合,如血蓝蛋白;氧分子的活化,如多巴胺羟化酶、酪氨酸酶等;电子传递,如质体蓝素;以及以Cu作为氧化还原活性金属的超氧化物歧化酶。Fe是生物体系中最为常见的微量金属,自从地球大气层中出现了氧气以来就形成了一种对Fe的依赖性,并伴随这亚铁离子向铁离子及不溶性氧化物、氢氧化物的转变过程。铁参与的过程及反应包括核苷酸的还原(DNA合成)、能量的产生(呼吸作用)、能量的转换(光和作用)、氮的还原、氧的运输(呼CopperIronIron(Hem)Iron(sulfur)Manganese
0
20
40
60
80
100
Proportion of FFs (%)
Metals and ions
His Cys Asp Glu
图1 组氨酸,半胱氨酸,天冬氨酸和谷氨酸在酶种类中的家族百分比
图2 位点、家族和酶的类型的分布 (a) 结合金属; (b) 催化位点
0
20
40
60
80
100
Proportion of FFs (%)
Metals and ions
Cys
Asp
His
Residues
Fe(S) Mn Cu Fe(Hem) Fe Co Ni
CFYKRHWTENDGSQA
0
1020304050
Percentage of FFs
Catalytic residues
OxidoreductasesTransferases
Hydrolases
Classa
b
生命科学仪器 2011 第9卷/4月刊
研究简报
43
滴定的—N—H基团,每个的pKa都在6左右,当其中一个基团丢失一个质子时,另一个的pKa将上升到10以上;当两个都被质子化时,整体带正电荷;当只有一个被质子化时兼备质子供体和质子受体的特性;完全质子化时带负电,极少发生这种情况。亲水性氨基酸残基可以在彼此之间或者肽链主链、极性有机分子和水分子之间形成氢键,这种形成氢键的趋势主导了氨基酸参与的相互作用,有的氨基酸还可以根据PH条件和微环境改变电荷状态,氨基酸侧链的化学性质对蛋白质折叠和功能具有重要影响[1]。
Asp,His,Glu在数据集中涉及的酶和家族的数目都是比较多的,随后我们将三者在酶分类中的分布进行了统计,我们发现,Asp,His,Glu在III类酶中涉及的家族数目最多(Fig. S4)。也就是说,酶的催化残基分布最多的偏亲水性的Asp,His,Glu在水解酶中的家族百分比最高,催化残基的亲水性与水解酶之间并没有存在必然的联系,但是氢键把两者紧密联系在一起[1]。
催化位点使用的氨基酸在不同类酶中使用的FF数目不同(Fig. 2b),其中Cys,Phe和Tyr在I类酶(即氧化还原酶类,Oxidoreductases)中使用率最高;Lys和Arg在II类酶(即转移酶类,Transferases)使用率最高;而His,Trp,Thr,Glu,Asn,Asp,Gly,Ser,Gln和Ala则在III类酶中使用率最高。可以看出,氧化还原酶中催化位点多为酸性氨基酸,转移
酶中催化位点多为碱性氨基酸,水解酶中催化位点多是亲水性的氨基酸。
4 结论
位点氨基酸性质决定着蛋白质结合的金属离子和催化的趋向,结合生物无机化学和生物有机化学的方法,从位点氨基酸的角度来探讨蛋白质结构和功能的关系,对阐明蛋白质与配体相互关系、蛋白质折叠机制和蛋白质设计都有着借鉴意义。
参考文献:
[1] G.A.佩特斯科, D.林格著,葛晓春等译. 蛋白质结构与功
能入门[M]. 科学出版社, 2009:2-7.
[2] Kensuke Nakamura et al. MetalMine: a database of functional
metal-binding sites in proteins. Plant Biotechnology[J]. 2009, 26:517-521.
[3] A.G. Murzin. SCOP: a structural classification of proteins
database for the investigation of sequences and structures[J]. J Mol Biol. 1995, 247(4):536-540.
[4] Porter CT et al. The Catalytic Site Atlas: a resource of catalytic
sites and residues identified in enzymes using structural data[J]. Nucleic Acids Res. 2004, 32(Database issue):D129-D133.
[5] H.M. Berman et al. The Protein Data Bank[J]. Nucleic Acids
Res, 2004, 32 (Database issue):D129-D133.
[6] 杨频,高飞. 生物无机化学原理. 科学出版社. 2002:55-56.
No comments:
Post a Comment