- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
试验报告[2011-12-20]第1页,共2页编号农业微生物研究中心[2011
编号:生物[2011-12-20] 共13页
承担单位:福建省农科院农业生物资源研究所
试验设计:
试验项目:Perl脚本开发:qseq2fastq,
illumina qseq文件转换为fastq格式
试验人员:唐唯其
试验负责:
报告日期:2011-12-20
计数月份:2011年11月
研究资格系数
(0.5-1.0)
实验设计系数
(0.9-1.0)
报告得分
总分
实验设计
实验记载
实验分析
实验简报
实验文章
1-20%
21-40%
41-60%
61-80%
81-100%
1%-5%
设计,实施实验,记载,分析清晰,结论清晰文献完整,发表水平
农业微生物研究中心
电话: 0591 传真: 0591 试验目的
illumina测序产生的原始文件为qseq格式,而FASTQ格式在后续分析中,如de novo拼接、读段定位等,是最常用的序列格式。因此,首先需要将qseq文件转换为fastq文件。本文所写的Perl脚本就是将qseq文件转换为fastq格式。
1.1 qseq格式说明
其中第九列和第十列分别为读段和质量值,是主要内容。其次需要留意第十一列的过滤值,0表示读段的质量较低,应移除remove,1表示质量较高,应保留remain。而第八列Read Number,表示读段是SE还是PE,只有1时表示SE读段,出现2或3表示PE的另一条序列,2也可以表示标签。各列之间以Tab键分隔。
1.2 fastq格式说明
FASTQ格式是一种常用的带有质量值的序列格式,如下:
@title and optional description
sequence line(s)
+optional repeat of title line
quality line(s)
实例如下:
标题行可以自由命名,或者以下这条序列,来自NCBI SRA,
标题行规范化,如下:
@HWUSI-EAS679_00021:1:1:2320:944#TAGCTT/1
分别用下划线、冒号、井号和斜杠分开,这些内容来自于qseq文件,如下:
HWUSI-EAS679 00021 1 1 2320 944 0 1 ATCG QUAL 1
(蓝色部分一一对应,红色是标签信息,绿色是序列和质量值。)
实验内容
2.1 需求说明
每一轮illumina测序,会生成多个qseq文件,需要将多个qseq文件逐一转换为fastq格式,并合并在一个fastq文件中。
每一轮illumina测序可以包含不同样本的测序数据,因此在qseq文件中取出目标样本的序列,需要根据相应的标签(tag)信息进行选择。
illumina测序自动为每个读段设置一个过滤值,当该值为1时,表示读段质量较高,可以保留;当该值为0时,表示读段质量较低,需要去除remove。因此,在转换的同时,有必要同时进行过滤。
此外,illumina的双末端配对(Paired-End或Mate-Pair)测序,正向forward的qseq文件和反向reverse的qseq文件是一一对应、互相对齐的,在转换并过滤时,可以同时进行操作,这样可以保证forward读段和reverse读段在fastq文件中对齐。
(对应forward读段和reverse读段,似乎总是被同时过滤!)
最后,fastq的标题行需要规范定义。
2.2 qseq2fastq编程思想
Perl脚本qseq2fastq.PE-with-filtered.threads.pl是一个多线程同时转换并过滤Paired-End(PE)的多个qseq文件的程序,并且根据多个标签信息捡取目标样本的测序数据,从而实现上文所述的需求。
当前版本未对人机交互/命令行参数,以及帮助说明进行编辑。命令参数通过系统数组@ARGV来传递。依次为标签Tag文件,qseq目录和fastq输出路径,以及job线程数,默认为2。
子例程qseq2fastq_PE_with_filtered_thread是主函数,相当于Main函数。先要调用以下几个子例程:
子例程normalize_dir的功能设计:
标准化文件路径,如:J:\DeepSeq\fastq,转换为J:/DeepSeq/fastq/
子例程qseq_pairwise的功能设计:
qseq文件所在目录,共有三类qseq文件,文件名以“qseq.txt”为后缀,“_1”为正向Forward读段的qseq文件,“_3”为反向Reverse读段的qseq文件,“_2”为标签Tag的qseq文件。子例程qseq_pairwise只读取qseq文件夹路径,对三
您可能关注的文档
最近下载
- U校园-新一代大学英语(提高篇)综合教程1和2(全).pdf VIP
- 零星维修工程服务方案.pptx
- 地理试讲逐字稿 (一).pdf VIP
- 2011年滁州市中学高级教师专业技术职务任职资格评审通过人....DOC VIP
- 中国铁路总公司关于取消铁路建设项目开工报告审批的通知,铁总计统[2015]252号.pdf VIP
- 标准图集-提灌站建设项目施工图.pdf VIP
- 18K802图集—暖通空调系统的检测与监控(水系统分册).pdf VIP
- 大学发展心理学考试(习题卷1).pdf VIP
- 泌尿、男性生殖系统.ppt VIP
- 建筑工程图集 12R11612K512:污水源热泵系统设计与安装.pdf VIP
文档评论(0)