蛋白质结构预测的理论方法及阶段
蛋白质结构预测的理论方法及阶段
第24卷第1期2007
年2月
生物学杂志JOURNALOFBIOLOGY
Vol124 No11
Feb,2007
蛋白质结构预测的理论方法及阶段
孙 侠,殷志祥
(安徽理工大学数理系,淮南 232001)
摘 要:一直以来,蛋白质结构预测都是人们研究的焦点,综述了蛋白质结构预测的几种理论方法和不同阶段。关键词:蛋白质结构预测;理论预测方法;预测阶段中图分类号:Q51
文献标识码:A
文章编号:1008-9632(2007)01-0016-02
1 引 言
随着三联体密码的破译,人们了解了遗传信息
由DNA到RNA再到多肽链合成的基本规律,但以一定氨基酸顺序排列的多肽链是如何形成有一定空间结构的蛋白质分子的,仍是分子生物学中心法则中尚未解决的问题。由于蛋白质工程技术的不断发展,已知的蛋白质一级序列数据远远超过结构数[1]
据,基酸序列测定的速度重要。2 蛋白质结构预测的基本假设
蛋白质结构预测原理的基本假设是:蛋白质的三
[1]
级结构由其氨基酸序列唯一决定。这个假设是20世纪50年代由美国的Anfinsen小组对核糖核酸酶A被变性试剂还原后重新折叠的研究,加上核糖核酸酶片断互补的试验研究提出的,而其后的一些包括多链蛋白质的复性研究和一系列体外化学合成活性蛋白质的成功也支持这一经典假说。3 蛋白质结构预测的理论预测方法蛋白质结构预测的理论基础目前为:蛋白质的一
[2]
级结构决定高级结构。目前结构预测的方法总体可分为两大类。
[2]
3.1 理论分析方法 假设蛋白质分子天然构象处于热力学最稳定,能量最低状态,考虑蛋白质分子中所有原子间的相互作用以及蛋白质分子与溶剂之间的相互作用,采用分子力学的能量极小化方法,计算山蛋白质分子的天然空间结构。这类方法在实际应 收稿日期:2006-01-09
用时存在着三个主要问题:首先,从理论上计算蛋
白质分子空间结构需要精确地知道描述蛋白质-溶剂系统的力场和能量函数,而我们目前关于系统能量函数的了解还仅仅处于半定量的阶段;其次,目前数;最根本,,、有生物。3.2 第二类方法是统计方法 该类方法对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而根据映射模型对未知结构的蛋白质逐级从一级序列预测二级结构,再建立可能的三维模型,根据总结出的空间结构与其一级序列之间的规律,排除不合理的模型,再根据能量最低原理得到修正的结构,这即是所谓“基于知识的预测法”。这是进行蛋白质结构预测较为成功的一类方法,这类方法已经被成功地应用于同源蛋白质结构预测的研究。然而,对于同源性低和非同源的蛋白质分子来说,由于受到二级结构预测精度的限制,逐级预测的方法只取得了非常有限的成功。3.3 蛋白质结构预测的理论预测方法可细分为三大
[2]
[2]
类:3.3.1 同源模型化方法 其原理基于下述事实:一对自然进化的蛋白质,如果它们的序列具有25%~30%的等同部分或者更多,则可以假设这两个蛋白质折叠成相似的空间结构。这样,如果一个未知结构的蛋白质与一个已知结构的蛋白质具有足够的序列相似性,那么可以根据相似性原理给未知结构的蛋白质构造一
[3~5]
作者简介:孙侠(1980-),女,在读硕士,主要研究方向为组合优化、DNA计算及蛋白质结构预测;通讯作者:殷志祥(1966-),男,教授,博士。
基金项目:国家自然科学基金资助项目(60274026,30570431);安徽省教育厅自然科学重点项目;安徽省优秀青年基金(06042088)及安徽理工大
学博士基金联合资助
16
蛋白质结构预测的理论方法及阶段
年月
个近似的三维模型。如果目标蛋白质序列的某一部分与已知结构的蛋白质的某一结构域区域相似,则可以认为目标蛋白质具有相同的结构域或者功能区域。同源模型化方法属于基于知识的预测法,是结果最可靠的方法。基本过程包括六部分:目标序列与模板序列的匹配;根据同源蛋白质的多重序列匹配结果,确定同源蛋白质的结构保守区以及相应的框架结构;目标蛋白质结构保守区的主链模建;目标蛋白质结构变异区的主链模建;侧链的安装和优化;对模建结构进行优化和评估。其中序列匹配对建立精确的结构模型起着关键作用。
一般地,序列同源性越差,匹配的准确程度越低,建立的模型精度也越差,等同序列不到25%的远程同源的蛋白质不能被传统的序列比对方法所识别。对于一个未知结构的蛋白质,当我们找不到等同序列大于25%的己知结构的同源蛋白质时,可通过“线索技术”寻找已知结构的远程同源蛋白质,进而预测其结构。3.3.2 反向折叠法 数的全局极小点对应蛋白质天然结构;其次,在蛋白质
的势能面上存在着极多的局部极小点,但是缺少一种有效的全局优化算法。在利用分子力场建立能量函数的过程中,模型的准确性和模型的简化是需要权衡的基本矛盾。4 蛋白质结构预测的阶段
一般用一级结构、二级结构、三级结构表示蛋白分子的不同结构层次。根据蛋白质的层次可将蛋白质结构预测分为:4.1 蛋白质结构类型预测 结构类型(Structuralclas2ses)是根据蛋白中氨基酸所形成的二级结构(α-螺β-折叠、β-转角)的不同含量来进行分类的[1]。旋、
已知结构的蛋白质根据二级结构组成的不同可分为五
β类蛋白质类:α类蛋白质(主要由α-螺旋组成)、
(主要由β-折叠组成)、α/β(由α-螺旋和β-)+(由分开的α-螺)和。结构类,其预测结果除能了解大概的蛋白质结构折叠情况外,对二级结构的预测也有帮助。4.2 蛋白质二级结构预测 二级结构预测的目标就是预测某一个片段中心的残基是处于α螺旋还是β折叠,或是其他。蛋白质二级结构预测是解决蛋白质结构预测问题的最关键的步骤。一般认为,如果二级结构的预测准确率可以达到80%的话,就可以基本准确地预测一个蛋白质分子的空间结构。在二级结构预测方面主要有立体化学方法、统计方法、最邻近决策方法、人工神经网络方法等等。尽管人们已经建立了许多二级结构的预测方法,但其准确率一般都不超过65%,这很可能是由于所有这些方法只利用序列的局部信息,而局部序列对二级结构的影响只占65%左右,所以在预测蛋白质二级结构时需要考虑全局信息和进化信息等。4.3 预测蛋白质的三级结构 三维结构预测是蛋白质结构预测的最终目标,目前还没有一种预测方法能得到比较满意的结果。蛋白质的三维结构预测的一个方向是根据二级结构预测的结果以及蛋白质结构类型和折叠类型预测的结果,把可信度较高的二级结构进一步组装搭建出最后的蛋白质空间结构。这种方法虽可构建出一些蛋白质结构,不过因为它依赖于前面的预测结果,所以受到的限制太多。另一个方向是不依赖二级结构预测的结果,直接预测三维结构的方法。
(下转15页)比较成功的理论方法是同源模型法。
17
[7]
情况中,的限度,蛋白的序列和已知的结构进行匹配,找出一种或几种匹配最好的结构作为未知蛋白质的预测结构。实现过程是总结出已知的独立的蛋白质结构模式作为未知结构进行匹配的模板,然后用经过对现有的数据库的学习总结出的可以区分正误结构的平均势函数(MeanForceField),作为判别标准来选择出最佳的匹配方式。这种方法的局限性在于它假设蛋白质折叠类型是有限的,所以只有未知蛋白质和已知蛋白质结构相像时,才有可能预测出未知的蛋白质结构。如未知蛋白质结构是现在还没有出现的结构类型时,这种方法将不能被应用。3.3.3 从头预测法 理论依据是1973年Anfinsen提出的蛋白质的 …… 此处隐藏:4629字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [高等教育]一年级家长课程教案
- [高等教育]封丘县人民医院深入推进纠正医药购销领
- [高等教育]2017年6月大学英语四级真题试卷及答案(
- [高等教育]2017年北京第二外国语学院文学院824中
- [高等教育]7 高中历史第7单元1861年俄国农奴制改
- [高等教育]【K12学习】4、实际测量-苏教版六年级
- [高等教育]药具培训试卷题库及部分参考答案
- [高等教育]本土电子元器件目录分销商如何赢得生意
- [高等教育]七年级岭南版美术教案
- [高等教育]书作文之书法活动通讯稿
- [高等教育]Endnote X 软件使用入门和用法总结(LS)
- [高等教育]嵌入式系统的现状及发展状况
- [高等教育]2012抗菌药物专项整治活动方案解读
- [高等教育]人教版新课本一年级数学下册期末试卷
- [高等教育]爱课程民法学观后感
- [高等教育]930机组使用说明书1
- [高等教育]煤气设备设施点检标准
- [高等教育]常见室内观叶植物图解
- [高等教育]312党员群众路线心得体会
- [高等教育]小学信息(苗版)第一册全册教案
- 在市---局2010党建大会上的讲话
- 《科哲》提纲及补充阅读材料(2010.7)
- 苏州高博软件技术职业学院论文开题报告
- 兼职导游管理的困境及对策探讨
- 基于通用设计理念的现代厨房产品语义研
- 康乐一中2010年至2011年度鼓号队、花束
- 第10章_数据收集整理与描述_期末复习课
- 2008年黑龙江林甸商贸购物中心营销策划
- 水硬度的测定实验报告
- 五分钟教你拍摄夜景光绘照
- 2014年临床妇产科三基三严试题及答案
- 0第二课 纾解压力第一站了解压力
- 解析建筑工程电气设备安装施工技术要点
- 地方性应用型本科高校“双师型”师资队
- 高考语文专题复习课件:小说阅读指导
- 装饰工程投标书2
- 大学生就业难问题探讨及对策
- English and Its History
- 青岛市城市房屋修缮工程质量监督管理办
- 初中英语形容词和副词的用法和练习题




