chimera分析总结.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Chimera分析总结 得到chimera 筛选出长度20bp的reads:1206906个比对结果,reads数472695个。 (/ifs1/ST_MD/USER/caixiangxing/single_cell_Assembler/chimera/find_chimera/paper/ chimera.above20) 筛选掉没有组合的情况,剩下:385830个比对结果,reads数164943个。 组合满足的条件是:(1)有两段总长100%;(2)两段都20bp。 去掉多种组合的或是某一段比上多出的(认为这是有歧义的),只保留一对组合的:310994个比对结果,reads数155497条。 把这155497条当做最终的chimera。参考文章当中共找出495条有嵌合体的read,这些read对应我们这里的条件应该是“read有两段组成;两段占read总长100%;两段长度都大于20”,按照这样的条件我们数据中这类read的条数RNT是多少(不是比对结果数)? 参考文章中495个里面有20个是有歧义的,我们这里可以认为满足下面其中一个条件的read是有歧义的“一条read有多种组成方式;一条read的某一段能比上多出”,这样???read数RNA是多少? 剩下没有歧义的就是155497? 应该等于RNT-RNA  之前里头所有的个数条数,都是reads数,不是比对结果数,计数的时候有考虑到;现在两种都表示出来。 155497条是剩下的没有歧义的。 歧义的reads数有9449条,占存在组合的reads总数5.73%(文章中是4.0%,495条中有20条歧义的)。 Reads数总共,29M。chimera占0.534%。 二、分析chimera 将chimera分为有overlap(=2bp)128178条(82.43%)和overlap 2bp(包括无overlap的)27319条,两种情况。 以下是对overlap(=2bp)Chimera的分析: 有overlap(=2bp)的Chimera深度特点分析 将chimera分成三段,起始段,覆盖overlap段,结束段。 查看有overlap(=2bp)的chimera,覆盖overlap段kmer深度情况,与其余两段的kmer深度进行对比。 (/ifs1/ST_MD/USER/caixiangxing/single_cell_Assembler/chimera/find_chimera/paper/step7.chimera.depth.num2.1) 发现有很多overlap段kmer深度情况很小,其余两段深度很大。 分析有overlap(=2bp)的chimera深度品均值 (1)分成三段的情况 Overlap段平均值均小于另外两段品均值0.6倍的,50966个 Overlap段平均值均小于另外两段品均值0.7倍的,52153个 (2)若只分成两段(第一段或第三段为空为空) overlap段深度平均值小于0.6倍另一段的品均值的,有1170个。 以上两种情况是显著的chimera情况 128178个去除以上两种还有74855个。不知有没有可能是重复序列,分辨不出是chimera,还是重复序列。 Chimera类型分析 四种类型chimera个数: 嵌合体类型Reads类型ABCDOverlap(=2bp)这个chimera的类型统计为什么要基于overlap =2 来统计呢? 50474191104111117483Overlap=1bp或无overlap58695527560610317A,C两种类型所占比例总的比例66.3% Chimara Overlap长度分布 分布图只画0-20bp的吧,20bp以上基本没有看 峰值出现在overlap=5bp处。 这个会不会与MDA扩增有关。 overlap区域与两端区域的平均kemer深度的分布图 两端区域平均kmer深度分布 Overlap区域平均kmer深度分布 Overlap区域平均kmer深度很低的chimera很多。 overlap区域与两端区域的平均kemer深度的比值: 分布图:这个究竟是谁比谁?如果是overlap比两端,那我们的关心的重点不应该是0到1之间吗?增加一个图中只显示该区域,大于1部分可以只给一个总比例 累积分布图: 只看0-1之间 Overlap与两端区域平均深度比值,66.8%的chimera=1剩下的33.2%(你0-1的分布图出来后,cutoff根据图再确定),具体什么情况得调查一下,譬如这些read平均深度是多少?只是这些read的深度分布如何?有什么特征? 更有超过50%的比值是小于0.01的。 c

文档评论(0)

peace0308 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档