- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
摘 要
可转座元件fiE)存在于几乎所有真核生物中,是许多基因组,特别是植物基
因组的重要甚至主要成分。LTR反转录转座子是一类通过“复制.粘贴”模式进行
转座的TE。它们的活动提供了植物基因组结构与功能进化的重要机制:已经知
道,它们参与塑造基因组的组织结构与大小,影响基因的调控与变异和引起新基
因的起源,同时它们还是分子生物学突变诱导的重要工具。研究LTR反转录转座
子在理论和应用方面都有重大意义。
随着测序技术的发展,一个迫切的问题是如何有效地从未经注释的基因组
序列数据中发现LTR反转录转座子。本文首次建立起一套全基因组LTR反转录转
座子注释的框架。该框架整合了从头算起,比较基因组学和同源搜索一拷贝数验
证三个独立的功能模块,形成了完整的LTR反转录转座子预测流程。
特征,在单个基因组上搜索满足这些特征的区域。该程序通过四步来发现一个
全长LTR反转录转座子:第一步采用后缀矩阵数据结构来定位和存贮基因组中的
所有精确匹配序列对;第二步以精确匹配序列对为种子,通过连接相邻种子来
构造可能的LTR区域:第三步通过序列联配发现最可能的转座子边界;第四步利
用LTR转座子内部的结构特征序列确认全长转座子的存在。
第二个模块L1R卫qSERT引入比较基因组学方法,同时分析转座子复制插入
在基因组上留下的序列信号和转座子的结构特征,在两个基因组之间实现可靠
的LTR反转录转座子预测。首先,LTRJNSERT构造全基因组联配并将联配分为
同源区集合和增删区集合两个部分;第二步分析增胛J区及其邻域,发现基因组分
化后插入的全长LTR转座子;第三步则分析同源区以预测分化前插入的LTR转座
子。
在以上两个模块的基础上,我们还发展了同源搜索一拷贝数验证模块,
相关的LTR转座子序列。该模块实现对LTR转座子的边界修正、转座子内部
非相关序列的识别和去除、多拷贝数的确认及对LTR反转录转座子分类等功
以分别达到对单基因组与对两个近缘物种基因组中LTR反转录转座子进行有效
3
摘要
注释的目的。总之,三个模块分别提供结构,插入和拷贝数三项独立证据来预
测L1限转座子,每一个由此流程预测的LTR转座子都有至少两项支持。
随后我们将所发展的注释方法应用在水稻两个亚种基因组的比较研究
中。采用比较基因组模块与同源搜索.拷贝数验证模块相结合的途径,通过构
造和搜索亚洲栽培稻籼粳两个亚种的全基因组序列联配,我们共预测到993个
全长LTR反转录转座子并在两个基因组中注释了15916条与之相关的拷贝;发
现80个水稻LTR转座子的新家族,其中16个与目前已报道的所有家族没有任何匹
配。通过对全长LTR转座子的分子进化分析,我们发现水稻两亚种之问在相当近
的时期(5万3千年)内存在较大规模的跨亚种遗传物质交流,并证明这种交流是
通过亚种间同源非可往复重组(ISNR)实现的。然后,我们对基因组的其它功能
或非功能区域作了大规模采样以验证这一事实,并估计此类重组事件涉及占水
稻基因组总量至少15.3%的区域。此外,LTR转座子还提供两重独立证据表明籼
粳稻基因组的分化发生在距今60万年前。我们还研究了水稻中的LTR转座子家
族的进化模式,发现如下特点:1)水稻中反转录转座子在两亚种基因组“背景”分
离后仍然处于活跃状态,并且在两个基因组上的活跃程度大致相当:2)绝大部
分LTR反转录复制事件是由相当少的家族完成的;3)籼粳分化事件并没有对高
活性LTR家族的活动造成显著的影响;4)LTR反转录转座子在基因组上的分布是
非随机的,倾向于在着丝粒附近集中。此工作第一次从比较基因组学的角度出
发,在全基因组的规模上对水稻亚种间的基因流动与渗入的规模作出了估计与
分析。
结合从头算起模块与同源搜索.拷贝数验证模块,我们在世界上首先对豆
科的模式植物蒺藜苜蓿基因组序列做了LTR反转录转座子的大规模描述和分
析。在可公开使用的、约占苜蓿基因组总量近一半的序列中,我们发现526个全
长LTR反转录转座子和与之相关的17421个拷贝:发现苜蓿基因组LTR反转录转
座子至少可分为85个家族,其中66个为本研究首次报道。我们研究了各个家族
的PBS使用偏好和内部区域蛋白质组织方式,并讨论了LTR反转录转座子的进
化亲缘关系。苜蓿中的全长LTR反转录转座子主要分为Copia和Gypsy两个超家
族,后者尽管在家族数量上仅为前者的1/
原创力文档


文档评论(0)