高通量数据处理流程.pptxVIP

  • 27
  • 0
  • 约1.77千字
  • 约 37页
  • 2021-07-27 发布于河北
  • 举报
;图像分析及basecalling基本原理;图像分析及basecalling基本原理;图像分析;Crosstalk AC光谱间有交叠,GT光谱间有交叠,所以:    碱基A的图片中包含C发出的光    碱基C的图片中包含A发出的光    碱基T的图片中包含G发出的光 不利:不能直接比较光强度大小而得到碱基 有利:利用图片中共同的亮点,将所有图片对齐重叠,解决offset问题;图像分析流程;Template Generation 利用AC之间的crosstalk、GT之间的crosstalk,将前 2个cycle的图片,与第一个cycle的A的图片对齐重叠,确定所有cluster的位置坐标{(x,y)};图像分析结果;Basecalling;4种光强度归一化;;Basecalling结果:qseq文件;Basecalling结果:qseq文件;fastq文件; 质量值 @FC61FL8AAXX:1:17:1012:19200#GCCAAT/1 CCACTGTCATGTGAACATCACAGAGACATTTCTTGA + bbbbbbbbbbabbbbbbbbbbbbbbaaaaaaaaa_\ 表示方法 Illumina:字符的ASCII值 - 64 = 质量值 (Sanger:字符的ASCII值 - 33 = 质量值) 范围 GA Illumina1.3+(09年3月之后): [2,35] [B,c] GA Illumina1.0 (09年3月之前): [-5,40] [;,h] Hiseq: [2:38] [B,f] 质量值与错误率理论关系: Q =-10 log10(e) 质量值计算方法:根据光强信号信噪比、光强度衰减、GC含量等参数,计算质量值;fastq文件;fastq文件产量(GA);fastq文件产量(Hiseq vs GA);文库质控问题1:Pair-end关系;与参考序列比较 或者: 总之,Read1,Read2与参考序列比对结果:   一正(F)一反(R),且F的位点坐标小于R的位点坐标 ;总之,Read1,Read2于参考序列比对结果:   一正(F)一反(R),且F的位点坐标小于R的位点坐标 文库插入片段长度;2100检测报告 文库长度分布;正常insert-size分布;异常insert-size分布;2K及以上文库;与参考序列比较 或者: 总之,Read1,Read2于参考序列比对结果:   一正(F)一反(R),且F的位点坐标大于R的位点坐标;正常insert-size分布;异常insert-size分布;文库问题2:adapter污染;adapter空载较多 导致碱基含量波动;文库质控问题3:文库随机性;测序质控问题;测序质控问题;正常光强度、碱基含量、质量值、Error-rate;异常光强度、碱基含量、质量值、Error-rate;异常光强度与碱基含量;9、有时候读书是一种巧妙地避开思考的方法。1月-211月-21Monday, January 25, 2021 10??阅读一切好书如同和过去最杰出的人谈话。21:39:4921:39:4921:391/25/2021 9:39:49 PM 11、越是没有本领的就越加自命不凡。1月-2121:39:4921:39Jan-2125-Jan-21 12、越是无能的人,越喜欢挑剔别人的错儿。21:39:4921:39:4921:39Monday, January 25, 2021 13、知人者智,自知者明。胜人者有力,自胜者强。1月-211月-2121:39:4921:39:49January 25, 2021 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。25 一月 20219:39:49 下午21:39:491月-21 15、最具挑战性的挑战莫过于提升自我。。一月 219:39 下午1月-2121:39January 25, 2021 16、业余生活要有意义,不要越轨。2021/1/25 21:39:4921:39:4925 January 2021 17、一个人即使已登上顶峰,也仍要自强不息。9:39:49 下午9:39 下午21:39:491月-21

文档评论(0)

1亿VIP精品文档

相关文档