基于蛋白质序列组蛋白去乙酰化酶关键氨基酸位点预测.docVIP

基于蛋白质序列组蛋白去乙酰化酶关键氨基酸位点预测.doc

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于蛋白质序列组蛋白去乙酰化酶关键氨基酸位点预测

基于蛋白质序列组蛋白去乙酰化酶关键氨基酸位点预测   摘#8195;要基于构建的统计偶联分析平台,根据组蛋白去乙酰化酶的氨基酸序列,分析了该蛋白所有氨基酸位点的统计能量,预测了关键氨基酸位点,有助于组蛋白去乙酰化酶的功能研究。   关键词MATLAB编程语言;统计偶联分析平台;组蛋白去乙酰化酶   中图分类号Q5文献标识码A文章编号1673-9671-(2011)052-0199-02      蛋白质氨基酸位点之间的偶联分析或称之关联突变是指:在蛋白质序列中,如果一个氨基酸位点上的突变性质或概率依赖于另一个位点上的突变性质或概率,则认为这两个位点是偶联的。偶联的两个氨基酸位点可能在空间上相互接触,也可能在空间上相隔很远。蛋白质中氨基酸位点之间的偶联对其功能和结构非常重要。偶联分析方法现有两类:分析物理上相互接触的氨基酸位点之间的偶联关系;既可以分析相互接触的氨基酸位点之间的偶联关系,还可以分析非接触氨基酸位点之间的偶联关系。   组蛋白去乙酰化酶 (histone deacetylases,HDACs)是调控基因的关键蛋白酶,它的功能是否正常和肿瘤的发生发展有直接关系。通过对HDACs功能的抑制调节,可以达到治疗肿瘤的目的。本文基于Ranganathan的偶联分析方法,构建了统计偶联分析平台,对HDACs家族进行统计偶联分析,预测了HDACs中关键的氨基酸位点,有助于HDACs结构和功能的研究。   1统计偶联分析的基本原理   在蛋白质一个功能位点上的扰动(相当于起源于蛋白质一个功能位点上的信号)――例如,底物结合、共价修饰或突变――将引起蛋白质的构象变化,从而把信号传递到蛋白质上另一功能位点。从生物学角度,这种构象变化代表一种能量传递机制。即当底物和蛋白质结合时,相当于在蛋白质各氨基酸位点的能量分布上加了一个扰动,将使蛋白质的能量分布改变。而这种能量分布的改变体现了蛋白质中构成各功能位点的氨基酸位点之间的功能偶联关系。在一个蛋白质中,如果两个氨基酸位点是功能偶联的,即使这两个氨基酸位点在结构上相距很远,他们在进化过程中是相互约束的。如果对该蛋白质家族进行多序列比对(Multiple sequence alignment, MSA),则此MSA包含了偶联氨基酸位点在进化中相互约束的信息。   组成天然蛋白质的氨基酸有20种,所以MSA中的氨基酸位点用含20个元素的矢量来描述,每一个元素代表一种氨基酸:   (1)   其中ΔG#8201;xj(x表示A,C,…,Y 20种氨基酸)是氨基酸x在位点j相对于参考位点ref的统计自由能量(简称统计能量),由Boltzmann分布给出:    (2)   其中p#8201;xj是氨基酸x在位点j上的概率;p#8201;xref是氨基酸x在参考位点ref上的概率;kT*是一种能量单位。氨基酸位点j统计能量的大小定义为式(1)矢量的模:    (3)   统计偶联分析方法通过在MSA中提取子比对来实现扰动。例如提取MSA中某个位点α上包含酪氨酸Y的序列组成一个MSA,称此MSA为子比对(原来的MSA称为父比对)。氨基酸位点α为干扰位点。可以同理计算子比对中各氨基酸位点上的统计能量:    (4)   把子比对中氨基酸位点j的统计能量和父比对中相同氨基酸位点上的统计能量相比较,即得氨基酸位点j能量变化的情况:   (5)   (6)   反映了在位点α上加扰动后位点j上能量分布的变化情况,   表示位点α和j之间的统计偶联,其值的大小表示两个氨基酸位   点之间的偶联程度,称为统计偶联能量。   在MATLAB6.5上构建了统计偶联分析平台。平台由5个模块组成:用户界面模块;氨基酸概率模块;父比对模块;子比对模块;统计偶联能量图模块。用户提供目标蛋白质的MSA,即可预测目标蛋白中关键氨基酸位点以及各位点之间的偶联程度。   2HDACs统计偶联分析   以人HDAC8(GenBank: AAF73428.1)为目标序列,从Pfam(http://pfam.sanger.ac.uk)中获取HDACs家族(Pfam:PF00850)蛋白质序列。在该家族序列中去除冗余序列,最终得到958条序列。利用ClustalW对此958条序列进行MSA,并验证HDAC MSA的多样性和样本量。根据各氨基酸在HADC MSA中各位点上的频率分布,和各氨基酸在Swiss-Prot库所有真核蛋白质序列中的频率分布进行比较。标准差最小的5个氨基酸位点为:337、64、338、348、51(人HDAC8中的氨基酸位点序号),它们的标准差在0.03以内,最小值为0.026,频率分布和平均值接近,说明MSA在序列空间上具有多样性。   根据上述标准差最小的5个氨基酸

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档