- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用Bioperl模块作数据分析
如何进行多序列比对 实例10:调用应用程序clustalw进行序列比对 $factory为Clustalw模块的一个实例 主要方法: new,参数中包含clustalw运行的主要参数,返回一个Clustalw模块的实例; align,以序列对象的数组地址为参数,调用clustalw程序进行多序列比对,返回一个AlignI模块的实例; 分析管道2:胰腺核酸酶进化分析 从远程数据库获取序列 序列长度分析 核苷酸序列的提取 核苷酸序列翻译到蛋白质序列 调用ClustalW进行多序列比对(蛋白质水平) 根据蛋白质序列比对产生核苷酸序列比对 进化距离的获取 同义和非同义替代率的获取 已知条件:文章(Zhang et al., 2002)中记录的17条胰腺核酸酶登录号: AF449628~AF449644 后续分析:水稻叶绿体蛋白质组的分析…. Outline Perl和Bioperl简介 基本概念 序列处理 比对处理 +比对文件格式的转换 +进化距离的计算 +同义替换率(D_s)和非同义替换率(D_n)的计算 +序列联配的自动化进行 +比对处理的管道设计 Outline Perl和Bioperl简介 基本概念 序列处理 比对处理 序列格式介绍 文件格式:embl fasta格式 embl格式 序列文件格式的转换 1,提出问题:如何进行文件格式的转换?(实例1) fasta格式 genbank格式 embl格式 序列文件格式的转换 2,是否已经相关代码? Bioperl中SeqIO模块,封装了序列有关的文件读写 通过use Bio::SeqIO;语句告诉程序要使用SeqIO模块 方法 参数 返回值 作用 new 序列文件、序列格式 SeqIO模块实例 产生一个与文件关联的变量 next_seq 无 序列(Seq模块实例) 从文件中读取序列,但每次只读一条 write_seq 序列(Seq模块实例) 成功返回1,否则0 往文件写一条序列 3,解决方案: 3.1 利用SeqIO模块中的new方法产生一个读实例 3.2 利用SeqIO模块中的new方法产生一个写实例 3.3 从读实例中取序列 3.4 通过写实例往文件存入序列 3.5 反复操作3.3和3.4,直到读实例中无序列可取 序列文件格式的转换 序列文件格式的转换 4,编写代码 $in和$out均为SeqIO模块的实例 $seq为Seq模块的实例 序列文件格式的转换 5,运行代码: 首先要准备好待转换的序列文件 将上述代码保存到文件ex001.pl 在命令行上,进入工作目录 在命令行上,键入命令perl ex001.pl 查看结果 序列文件格式的转换 1.明确问题 -将某个序列文件的格式改成其它格式 2.寻找已经存在的代码 -Bio::SeqIO模块 3.确定解决方案 -分别产生一个读实例和一个写实例 -读实例不断地读取序列到内存 -同时写实例不断地把内存中的序列写到文件 4.编写代码 -关键变量$in, $out, $seq -while -修改 -调试 -修改 5.运行程序 DNA序列的翻译 问题2:DNA序列的翻译? ...... ...... 64密码子 20氨基酸+终止信号 DNA序列的翻译 $seq和$prot两个均为Seq模块实例 2,已存在的代码;3,解决方案;4:代码编写 DNA序列的翻译 5,运行代码后,结果展示如下: 序列的统计信息:长度分布 提出问题:如何统计每条序列的长度?(实例3) 序列长度的计算 2,已存在的代码;3,解决方案;4代码编写: $seq为Seq模块实例 序列长度的计算 5,运行代码 后的结果展示: 借助于其它程序,比如perl,Excel可以获得下图 Seq模块总结 告诉程序要使用Seq模块?(即如何产生Seq模块实例?) 1,直接使用“use Bio::Seq;”语句;2,通过SeqIO模块中的next_seq方法;3,或者有关模块中的有关方法 方法 参数 返回值 new 序列名称(id)、序列本身(一段字符串)…… Seq模块实例 id 无,或者序列的新名称 序列名称 desc 无,或者序列的新描述 序列描述 Length 无 序列长度 seq 无,或者Seq模块实例的新序列 序列(用一串字符表示) subseq 起始位点,终止位点 子序列(一串字符) alphabet DNA,或者RNA,或者protein 序列类型 Revcom 反向互补序列(Seq模块实例) translate 终止符的表示,frame,密码子表…. (大多数情况下采用默认值) 翻译后的蛋白质序列(可以认为是Seq模块实例) get_SeqFeatures 无 一系列的SeqFeatureI模块实例 序列特征表 问题4:如何解析
您可能关注的文档
- 教泰国人学汉语:请吃饭重点.ppt
- 教版思想政治高一第一单元第一课第一框 生活处处有哲学重点.ppt
- 教版语文九年级下册第六课《蒲柳人家》(第二课时)课件重点.ppt
- 教研组长的工作职责重点.ppt
- 教研组长的常规工作要求1重点.ppt
- 教科六年级下册品德与社会电子教案重点.doc
- 第13章 软件控制解析.ppt
- 你所不知道的日本文化.pptx
- 教科版-科学-五年级-上册-种子发芽实验(二)重点.ppt
- 教科版三上复习资料重点.doc
- 半导体材料性能提升技术突破与应用案例分析报告.docx
- 半导体设备国产化政策支持下的关键技术突破与应用前景报告.docx
- 剧本杀市场2025年区域扩张策略研究报告.docx
- 剧本杀行业2025人才培训体系构建中的市场需求与供给分析.docx
- 剧本杀行业2025年人才培训行业人才培养模式创新与探索.docx
- 剧本杀行业2025年内容创作人才需求报告.docx
- 剧本杀行业2025年区域市场区域剧本市场消费者满意度与市场竞争力研究报告.docx
- 剧本杀市场2025年区域竞争态势下的区域合作策略分析报告.docx
- 剧本杀行业2025人才培训与行业人才培养模式创新.docx
- 剧本杀行业剧本创作人才心理素质培养报告.docx
最近下载
- 中医诊所申请可行性报告.pptx VIP
- 凉山州布拖县考试招聘一村一幼辅导员考试试题及答案.pdf VIP
- 统编版语文四年级上册第三单元“连续观察”(主题阅读)含答案.pdf VIP
- 肺保护-胸外科.ppt VIP
- 巡视巡察领导自查报告问题清单.docx VIP
- 环境工程微生物-微生物生态.ppt VIP
- 2024下半年四川凉山州会理市招聘“一村一幼”辅导员56人笔试备考试题及答案解析.docx VIP
- 八年级上册因式分解练习200题及答案.docx VIP
- 2024四川凉山州美姑县教育体育和科学技术局考核招聘“一村一幼”辅导员340人笔试备考试题及答案解析.docx VIP
- 在全市党委系统信息工作会议上讲话党委会议.docx VIP
文档评论(0)