03_二代无参转录组测序-初级分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

无参考基因组RNASeq—初级数据分析上海派森诺生物科技股份有限公司王玲平生物信息分析工程师wanglp@

2Unigene功能注释Unigene表达定量Unigene结构分析测序下机数据数据过滤转录本拼接Unigene聚类InDel分析SNP分析SSR分析ORF分析差异表达分析聚类分析功能富集分析GO注释KEGG分析eggNOG分析转录本拼接

转录本拼接(OCL)3测序长度越短,测序量需求越大、覆盖深度需求越高滚雪球式的两两比对,需要巨大的运算量和运算时间

转录本拼接(DBG)4DebruijnGraph(DBG)PavelA.Pevzner,HaixuTang,andMichaelS.Waterman.AnEulerianpathapproachtoDNAfragmentassembly.ProcNatlAcadSciUSA.2001August14;98(17):9748–9753.

拼接结果的可靠性5测序错误: 形成马刺末端、泡重复序列: 形成麻绳末端、环基因多态性:形成泡覆盖度低: 无法连接两个图JasonR.Miller,SergeyKoren,andGrangerSutton.AssemblyAlgorithmsforNext-GenerationSequencingData.Genomics.2010June;95(6):315–327.

转录组的从头拼接6转录组拼接特殊性表达量差异可变剪切链特异性

评价拼接效果的指标7MaximumlengthAveragelength(初步检查拼接结果)Totallength(估计实际转录本大小)N50(一种加权中位数,完整性) 变种有CC50CPNG50等GC%(估计实际转录本碱基组成)DentEarletal.PatenAssemblathon1:Acompetitiveassessmentofdenovoshortreadassemblymethods.GenomeRes.2011;21:2224–2241.

拼接软件的选择8

拼接策略的选择9多K-mer拼接merge结果,效果好于单个K-mer拼接结果(转录组序列不是完全随机的)高灵敏度的拼接contigN50虽然很大,但低特异度低错误率多。在后续的transcript拼接中要付出一定的代价。

拼接软件(Trinity)10

拼接软件(Trinity)11https://usegalaxy.eu

文件内容说明:inchworm.K25.L48.DS.faa1;40total_counts:52410Seed:9K:25length:1346GGAGCTGGAGGCCCCCAGGCAACTACACCGTCCACGTA....序列编号:a1k-mer丰度值:52410k-mer长度:25bp序列长:3697bp12拼接软件(Trinity)

文件内容说明:Trinity.fastac0_g1_i1len=2071path=[53:0-2070]GAGCTCTTCAGGAGGGGGAATGTGCTTGTGGTTTTTGGTCTTGTGCATTTTGTGA……c0:序列来自编号0的contig集合g1:表示该集合下1号子集i1:子集里的序列编号len:序列长度path:路径的编号13拼接软件(Trinity)

14Unigene功能注释Unigene表达定量Unigene结构分析测序下机数据数据过滤转录本拼接Unigene聚类InDel分析SNP分析SSR分析ORF分析差异表达分析聚类分析功能富集分析GO注释KEGG分析eggNOG分析Unigene功能注释GO注释KEGG分析eggNOG分析

基因功能预测15序列比对法BLAST等与已知功能序列进行对位比较,通过打分确定最相似序列。(近缘序列预测)功能模型法HMM等 基于多重比对的结果进行蛋白质序列模式数据库构建,对输入序列进行结构域模式匹配。(亲缘关系较远的序列预测)

基因功能预测(Blast)16

基因功能预测(Blast)17

基因功能预测(Blast)18

注释数据库19NR:/blast/db/GO:/KEGG:http://www.genome.jp/kegg/eggNOG:http://eggnog.embl.de/version_4.0.beta/Swissprot:/docs/swiss-prot_guideline.html

N

文档评论(0)

135****3151 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档