- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
宏基因组结合16srrna数据分析方案116srrna扩增子测序标准
宏基因组结合16S rRNA 数据分析方案
1. 16S rRNA 扩增子测序标准分析流程
1.1 原始fastq 文件的paired end 双端序列拼接、质量过滤、转化为fasta 文件
1.2 动植物线粒体、叶绿体序列的检测及去除
1.3 嵌合体(chimera)序列的检测及去除
1.4 OTU 聚类
1.5 去除singleton (所有样品中,仅含1 条序列的OTU)
1.6 序列数目标准化(subsample 随机重抽样,按最少序列样品统一每个样品的序
列数目)
1.7 对OTU 代表性序列做物种分类,并统计门、纲、目、科、属的丰度(表格形
式) 。
2. 宏基因组标准分析流程 (MG-RAST 平台)
2.1 序列质量控制
去除paired-end fastq 序列中的低质量序列、人工重复序列。
2.2 识别rRNA
识别rRNA 序列,并鉴定其微生物来源;去除rRNA 序列后,剩下的序列用
于基因预测和功能注释。
2.3 基因预测
预测DNA 序列中编码蛋白质的部分(开放阅读框ORF) 。
2.4 基因注释
在数据库(常用的有KO、COG、SEED subsystems 等,只需选取其中一种
作为功能注释数据库)中比对预测的基因,得到其功能及生物来源信息。
2.5 序列数目统计
统计样本中各类功能、生物来源的序列数目。
2.6 多样本序列数目统计表
将多个样本的序列数目统计表整合到一起(每行为一个功能/生物类别,每
1
列为一个样本,相当于16S rRNA 分析中的OTU 表)。
2.7 序列数目标准化
目的:不同样本的有效序列数目(质量控制后的序列)都不相同,必须对数
据进行标准化才能进行样本之间的比较。
对样本有效序列数目进行标准化(假设最小样本含有 N 条有效序列,在序
列数目统计表中,对序列进行随机重抽样,最终使所有样本的序列数目统一为N
条),得到标准化的多样本序列数目统计表,然后计算某功能在某样本中的相对
丰度A :
A = i/N * 100%
其中i 为该功能在该样本中的有效序列数。
部分功能数据库 (例如KO 、COG、SEED subsystems )将功能划分为若干
等级(通常是Level 1 、Level 2 、Level 3 、Function 四个级别)的功能类别(Functional
Category ),根据标准化的多样本序列数目统计表,可以计算出各个功能类别的
丰度。同理可以计算出各个分类水平下的生物来源丰度。
注:宏基因组的生物来源丰度结果与基于16S rRNA 测序得到的群落丰度数
据并不是一回事。前者反映蛋白质编码序列的生物来源,不能准确反映群落结构。
3.功能结合生物来源分析 (可选步骤)
基于 MG-RAST 平台的宏基因组标准分析得到的蛋白质编码序列生物来源
注释和功能注释是各自独立的。如果想知道特定功能/基因来自哪些生物类群(以
及它们的比例),需要执行以下步骤:
3.1 在样本中筛选出特定功能的序列
3.2 对筛选出的功能序列进行生物来源注释
3.3 特定功能/基因的生物来源丰度表
执行步骤2.5-2.8,得到特定功能类别/基因的生物来源丰度表。
注:步骤3.1 可以筛选任何分类水平的功能,但最终结果只适用于该分类水
平,而不能细分到更低分类水平的功能。以SEED subsystems 数据库Level 1 的
碳水化合物代谢为例(碳水化合物代谢在Level 2 水平可分为CO2 固定、一碳代
谢等若干更细的功能),碳水化合物代谢为筛选条件执行3.1-3.3 的最终结果只能
2
得到碳水化合物代谢的生物来源丰度表,这个表无法告诉我们 CO2 固定、一碳
代谢等功能的生物来源丰度。
4. 个性化分析
4.1 多样性分析
4.1.1 alpha 多样性分析 (适合16S 和宏基因组)
根据标准化的多样本序列数目统计表,计算alpha 多样性指数(例如Shannon
指数、Chao1 丰富度
文档评论(0)