生物信息学大实验_实验指导.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验 1 基因组序列组装(软件 CAP3 的使用) 实验目的 1. 了解基因组测序原理和主要策略; 2. 掌握CAP3序列组装软件的使用方法。 实验原理 基因组测序常用的两种策略是克隆法(clone-based strategy)和全基因组鸟枪法 (whole genome shotgun method)。克隆法先将基因组DNA打成大的片段,连到载体上, 构建DNA文库;再对每一个大片段(克隆)打碎测序。序列组装时先组装成克隆,再组装 成染色体。克隆测序法的好处在于序列组装时可以利用已经定位的大片段克隆, 所以序 列组装起来较容易, 但是需要前期建立基因组物理图谱, 耗资大, 测序周期长。 全基因组鸟枪法测序无需构建各类复杂的物理图谱和遗传图谱,采用最经济有效的 实验设计方案,直接将整个基因组打成不同大小的DNA片段构建Shotgun文库,再用传统 Sanger测序法或Solexa等新一代测序技术对文库进行随机测序。最后运用生物信息学方 法将测序片段拼接成全基因组序列。该方法具有高通量、低成本优势。 序列组装时,先把把单条序列(read)组装成叠连群(contig)、再把叠连群组装 成“支架”(scaffold),最后组装成染色体。 本实验将练习在Linux环境下用CAP3软件组装流感病毒基因组。 1.CAP3 序列组装程序简介 Huang Xiaoqiu. 和 Madan,A. 开发的一套用于序列拼接的软件,此软件适用于小 的数据集或 EST 拼接,它有如下特征: 1. 应用正反向信息更正拼接错误、连接contigs。 2. 在序列拼接中应用 reads 的质量信息。 3. 自动截去 reads5`端、3`端的低质量区。 4. 产生 Consed 程序可读的ace 格式拼接结果文件。 5. CAP3 能用于Staden软件包的中的GAP4 软件。 2.下载 此软件可以免费下载,下载地址:http:///download.html。 填 写 基 本 信 息 表 格 , 即 可 下 载 。 CAP3 详 细 参 考 文 档 可 见 : http : ///sas.html。 3.安装 (1)上传cap3 的压缩包到本地linux/unix 运算服务器; (2)解压缩: bash-2.05b$ tar xvf cap3.tar CAP3/ CAP3/README CAP3/cap3 CAP3/doc CAP3/aceform CAP3/formcon (3)查看解压缩后的文件: bash-2.05b$ ls –l total 240 -rwxr-xr-x 1 soft bgi 25844 Sep 2 2002 formcon* -rwxr-xr-x 1 soft bgi 169836 Sep 2 2002 cap3* -rw-r----- 1 soft bgi 513 Aug 22 2002 README -rw------- 1 soft bgi 18448 Aug 22 2002 aceform -rw-r----- 1 soft bgi 18922 Jun 21 2002 doc 4. 使用 程序运行命令行: cap3 dna-file in fasta format [options] cap3.out 5.输入: 输入序列是普通的 FASTA 格式,如果序列文件名为“xyz”,则质量文件应命名为 “xyz.qual”,约束文件应命名为“xyz.con”。在命令行中只需输入序列文件,程序会 自动在相应的目录中寻找相应的质量文件和约束文件。 “xyz”格式如下: Sequence1 ACGTGCGCGATCGCCTGCTAGGCGTACGTCGCAGGCGATCGATGTGCTAGATCAGATGACA Sequence2 GGGCTAGATTAGCACCACATACATCGCTCA “xyz.qual”格式如下: R1 6 8 8 8 15 17 17 17 12 12 20 20 29 31 34 34 38 38 40 40 49 49 37 33 33 33 33 30 31 24 24 34 45 45 45 45 38 38 38 45 40 40 40 40 40 40 40 40 40 40 33 33 33 33 33 33 40 37 40 40 45 45 45 40 40 40 45 45 45 45 49 49 49 49 45 40 43 43 43 40 40 40 37 40 49 49 40 40 37 37 37 42 45 40 49 45 45 45 45 40 36 36 36 36

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档