- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
宏基因组上机操作手册
目录
TOC \o 1-3 \h \u 14057 0. 准备工作 2
28935 1. 宏基因组比对 2
1984 2. 宏基因组组装 3
10822 2.1 组装软件:SOAPdenovo 3
11473 2.2 组装软件:Meta-Velvet 6
19536 3 基因预测 6
2082 4 构建基因集 7
0. 准备工作
上机步骤如下:
mkdir ~/Metagenome #新建工作目录
cd ~/Metagenome #进入工作目录
cp -R /RealBio_Train/Metagenome/01_clean_reads ./ #拷贝数据
宏基因组比对
宏基因组的序列可以通过SOAPaligner比对软件,比对上目标基因组,从而进行物种注释或计算物种丰度。SOAPaligner需要先对目标基因组进行建库,建库命令如下:
2bwt-builder sequence file
SOAPaligner用法:
soap –a reads_a -b reads_b -D index.files -o PE_output -2 SE_output -m min_insert_size -x max_insert_size
其他重要参数:
Option
Type
Content
-r
INT
匹配到多处时的策略:
0:不显示;1:随机显示一个;2:全部
-M
INT
匹配模式:0:只允许完全匹配;1:允许一个错配;
2:允许两个错配;4:最佳匹配
-p
INT
程序运行的线程个数
上机内容为:
将拷贝得到的reads比对上微生物的基因组。
上机步骤如下:
cd ~/Metagenome #先进入个人目录下的工作目录
mkdir 02_alignment #新建02_alignment目录
cd 02_alignment #进入比对目录
cp /RealBio_Train/Metagenome/02_aligner/soapaligner.sh ./ #拷贝比对脚本
less test01.pm #查看比对结果
less test01.sm #查看比对结果
2. 宏基因组组装
基因组组装是指将测序仪产出的大量的DNA片段(Reads)拼接成原始的待测物种的染色体序列,可以类比为拼图游戏。本手册指导你如何使用SOAPdenovo(2.04)组装软件对鸟枪法测序数据进行组装。
2.1 组装软件:SOAPdenovo
SOAPdenovo的功能是对二代测序数据进行从头组装。使用SOAPdenovo前首先要清楚的是它的组装配置文件,该文件包含以下信息:
Option
Content
全局配置
max_rd_len
记录输入数据的最大读长,并根据这个配置输入缓存大小。
文库配置,每个文库需要以[LIB]表明
avg_ins
记录当前文库插入片段大小。
asm_flags
用来配置流程中哪些步骤用到当前文库数据:
1,表示当前文库只在构建contig时用到;
2,表示当前文库只在构建scaffold时用到;
3,表示当前文库在构建contig与scaffold时都用到。
rank
配置构建scaffold时当前文库的使用优先级,由于单端的reads不用于构建scaffold,该文库不用设置rank参数。
q1/q2,q
配置当前文库数据路径,q1/q2用于配置双端的reads,q用于配置单端的reads
本次上机使用到的完整的配置文件内容如下:
配置文件完成后,即可开始进行组装。组装分四步骤操作。
四个步骤分别是:
1. pregraph,De Bruijn图构建。输入组装配置文件,输出图信息文件,主要参数如下:
Option
Type
Content
-s
CONFIG
指定组装配置文件
-o
PREFIX
指定输出文件的前缀,由用户随意设定
-p
INT
指定使用的线程数目。SOAPdenovo使用了多线程技术以充分利用计算机资源,一般取运行机子的cpu核心数目即可,如你的机器是双核一个cpu的,那么可指定为2
-K
INT
指定需要构建De Bruijn图的kmer大小,应根据SOAPdenovo的版本设定。如使用31mer版本,则可取kmer为31,29,27等
-d
INT
指定构建完De Bruijn图后,需要对深度小于多少的kmer进行过滤,一般设置为1
2. 构建contig。输入上一步骤产生的图文件,输出contig序列文件,主要参数如下:
Option
Type
Content
-g
PREFIX
输入图文件前缀,应该与上面步骤中的-o参数一致
-D
INT
设定在进行构建contig时,需要对深度低于该设定参数的contig
文档评论(0)