钝顶螺旋藻转录组的研究遗传学专业论文.docxVIP

钝顶螺旋藻转录组的研究遗传学专业论文.docx

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
钝顶螺旋藻转录组的研究遗传学专业论文

温州医学院硕士学位论文钝顶螺旋藻转录组的研究 温州医学院硕士学位论文 钝顶螺旋藻转录组的研究 中文摘要 目的 本文旨在利用高通量测序技术(RNA-seq)对钝顶螺旋藻的转录组进行研究, 测序得到的转录组数据通过denovo组装、拼接并与蛋白质数据库111、Swiss.Prot、 KEGG和COG进行blastx比对,获得蛋白功能注释信息,进一步得到COG功 能分类信息、GO功能分类信息、KEGG代谢通路分析结果。在钝顶螺旋藻基因 组数据亟待完善的前提下,通过生物信息学方法分析得到转录本信息,用以校正 基因组注释信息。在蛋白组实验完成的前提下,与蛋白组数据进行初步整合分析, 得到差异条件下表达量发生变化的基因在正常条件下的基因转录信息。本文将为 后续的功能基因组、基因的结构与功能关系研究、各种诱导条件下的差异转录组 研究、基因表达的分子调控机理等研究奠定基础。 方法 培养螺旋藻,收集藻细胞,并用洗涤缓冲液除去杂菌、杂质。螺旋藻样品液 氮冻存,液氮研磨后用Trizol浸泡,干冰运送。提取RNA,进行转录组测序, 获得高通量测序结果。用SOAPdenovo组装软件做转录组从头组装,得到Unigene 序列,通过与蛋白质数据库llr、Swiss.Prot、KEGG和COG做blastx比对得到具 有最高序列相似性的蛋白,进而分析钝顶螺旋藻的基因产物直系同源性、基因功 能分类以及基因产物在细胞中的代谢途径。使用MAQ分析软件将转录组数据测 序读长Clean reads定位(map)到基因组序列上,使用SAM格式转换软件和 Cuttlinks分析软件得到转录本信息,进而校正基因组注释信息。从差异条件样品 的蛋白组中找到与正常培养条件(转录组测序样品培养条件与该正常条件一致) 对应的蛋白点,并找到这些点对应的基因,以转录本作库进行blast比对,获得 这些基因序列在转录本上的位置关系。并且对找到的蛋白点进行跨膜区预测、信 号肽预测和蛋白结构域预测等结构分析。 9士田拿口木 l钝顶螺旋藻样品RNA-seq一共得到13,588,892条测序读长(total reads), ; 总碱基数(total nucleotides)为1,223,000,280nt。拼接、组装、去除gap 屑% 善 (N)后得到Unigene为4338个。 2用blastx将Unigene序列比对到蛋白数据库,得到与给定Unigene具有最 高序列相似性的蛋白,从而得到该Unigene的COG蛋白功能注释信息。 温州医学院硕士学位论文 温州医学院硕士学位论文 最多的功能归类为通用功能(General function prediction only)占11.60%, 信号转导机制(Signal transduction mechanisms)占8.77%,氨基酸转移与 代谢(Amino acid transport and metabolism)占7.46%,能量产生与转化 ’ (Energy production and conversion)占6.79% ◆ 3搜索比较蛋白质功能分类数据库(Oene Ontology,GO),得到钝顶螺旋藻 Unigene的GO注释信息。比对结果显示,1945条Unigene与生物过程 (biological process)有关,1074条Unigene与细胞组分(cellular component) 有关,对应到分子功能(molecular function)的Unigene有1819条。 4根据KEG(;注释信息,我们进一步得到Unigene的Pathway注释结果共 141个蛋白质交互网络。得知参与糖酵解途径和糖异生途径的Unigene为 118条,参与戊糖磷酸途径的Unigene为48条,参与光合作用途径的 Unigene为62条。并将这些Unigene定位到转录本上,用RPKM法计算 表达量。 5在基因组上定位得到转录本信息,共1994个转录本。进而校正基因注释 信息ORFs。存在5种情况:至少涵盖一条基因组注释完整序列的转录本 共有1598个,与基因组注释序列部分重叠(overlap)的转录本有2226个, 还有419个转录本落在基因组注释序列内,2054个ORF无对应转录本信 息,以及获得未注释到的转录本35个。我们将最后一种情况无对应注释 信息的35个转录本与nr库(非冗余蛋白库)做blasm比对,得到这35 个转录本的蛋白注释信息。其中33个转录本有至少两个可信的比对结果。 6初步整合蛋白组数据,筛查蛋白组实验得到的蛋白点,并获取对应的基因 注释信息(Ol心)。找到在盐胁迫条件下产生三倍以上表达量变化的点 N467,N423和N109,这三个点对应的基因注释信息(OI强)依次

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档