基于密码子偏性和分枝聚类密码子置换模型统计推断-statistical inference of codon replacement model base on codon bias and branching clust.docxVIP

基于密码子偏性和分枝聚类密码子置换模型统计推断-statistical inference of codon replacement model base on codon bias and branching clust.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于密码子偏性和分枝聚类密码子置换模型统计推断-statistical inference of codon replacement model base on codon bias and branching clust

承诺书本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的结果。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所涉及的研究工作所做出贡献的其他个体和集体,均已在文中以明确方式标明。本人授权南京航空航天大学可以有权保留送交论文的复印件,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复印手段保存论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:摘要生物信息学是一门新兴交叉学科,研究内容涉及到生物学、数学和计算机等相关学科的知识。系统发生分析是生物信息学的重要研究内容之一,主要是利用概率统计方法和生物分子数据,对生物进化关系进行推断和评估。基于系统发生学的计算分子进化在进化遗传学、生态学、基因组学、病毒学和发育生物学等实验生物学领域都有很广泛地的应用,而以核苷酸、氨基酸或密码子为数据分类单元的概率置换模型的建立是计算分子进化的重要研究内容,因此,对概率置换模型的研究具有重要的意义。本文主要对基于密码子偏性和分枝聚类的密码子置换模型的参数进行统计推断。本文第二章基于密码子偏性与氨基酸生化距离建立新的密码子置换模型,将新模型应用到两个真实的数据集,并与原模型进行比较来分析新模型对数据的适应性。分析结果表明新模型比未考虑密码子偏性和氨基酸生化距离的模型能更好地拟合数据,对参数的估计更加合理。第三章我们针对进化位点的差异性,首先利用聚类分析法判断物种间的相似度。在此基础上,然后根据相似度对物种进行分支分类,对不同的分支类别设置不同选择压力系数,并利用最大似然法对模型的参数进行了估计,通过具体数据集计算出物种各分枝的不同选择压力系数,最后将新模型与原模型进行了比较。第四章主要讨论了EM算法对存在插入、缺损的观测序列构建系统发生树的参数估计问题,重点在于应用EM算法在简单密码子置换模型JC69和K80下,对含不完整数据的序列伽马距离进行参数估计,并介绍了检验系统发生树可靠性的方法。关键词:密码子置换模型,密码子使用偏性,氨基酸生化距离,EM算法,系统发生树IAbstractBioinformaticsisoneofthemostpopularfieldsofmultiplesubjects,whichinvolvesbiology,mathematics,computerscienceandtherelatedsubjects.Phylogeneticanalysis,asoneofimportantresearchcontentsofbioinformatics,makestheinferencesandevaluationofbiologicalevolutionalrelationshipsbyusingtheprobabilisticandstatisticalmethodsandbiomoleculardata.Thecomputationalmolecularevolutionbasedonphylogeneticshasbeenwidelyappliedinthefieldsofevolutionarygenetics,ecologyandgenomicscienceandsomebiologicalexperimentsciencessuchasvirologyanddevelopmentalbiology.Theestablishmentofprobabilisticsubstitutionmodelsbetweenbiologicaldataunitssuchasnucleotides,aminoacidsorcodonsisoneofthemajorresearchcontents.Thusthestudyofprobabilisticsubstitutionmodelsissignificantlymeaningful.Inthisthesis,statisticalinferenceforparametersofcodonsubstitutionmodelsbasedoncodonusagebiasandbranchclusteringispresented.Inchapter2,anewcodonsubstitutionmodelbasedonaminoacidbiochemistrydistancesandcodonusagebiasisimplemented,andtheapplicationofthecodingsequencesoftwodatasetsareanalyzed.Theanalyticresultssuggestthatthenewcodonsubstit

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档