序列比对——生物信息学实习报告.doc

序列比对——生物信息学实习报告.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
序列比对——生物信息学实习报告

实习 二 : 序列比对 学号 20090***** 姓名 **** 专业年级 生技技术**** 实验时间 2012.6.13 提交报告时间 2012.6.14 实验目的: 学会使用EMBOSS软件包的NEEDLE和WATER进行两条序列比对 学会使用MegAlign进行两条和多条序列比对 学会使用ClustalX和MUSCLE进行多条序列比对分析 实验内容: 两条序列比对 EMBOSS全称是The European Biology Open Software Suite,是一个开放源代码的分子生物学分析软件包。本次实习利用分别利用全局比对软件Needle和局部比对软件Water的在线版本进行。 动态规划算法全局比对(Needle):在线软件网址为http://www.ebi.ac.uk/Tools/psa,利用火狐浏览器进入,选择Needle工具对自己选择的序列进行序列全局比对。 动态规划算法局部比对(Water):在线软件网址为http://www.ebi.ac.uk/Tools/psa,利用火狐浏览器进入,选择Water工具对自己选择的序列进行序列局部比对,并和Needle比对结果进行比较,分析差异产生的原因。 利用MegAlign软件分别对核酸序列和蛋白质序列进行两条和多条序列比对,并分析比对结果。 利用Clustalx软件分别对核酸序列和蛋白质序列进行多条序列比对,并分析比对结果。 利用MUSCLE在线工具分别对核酸序列和蛋白质序列进行多条序列比对,并分析比对结果。 比较MegAlign,Clustalx,MUSCLE比对结果的异同。 作业: 从上节课搜索到的同源核酸和蛋白质序列中各任意选两条,分别使用Needle和water进行比对,分析对比结果是否存在差异,为什么? 答:选用核酸序列为NM_002964.4和XM_001137986.1;选用蛋白质序列为:XP_001110530.1和NP_001139616.1。 核酸比对中,Needle比对结果和water比对结果存在差异: water:Length: 541, Identity: 445/541 (82.3%), Similarity: 445/541 (82.3%), Gaps: 78/541 (14.4%) ,Score: 1962.0 needle: Length: 563,Identity: 445/563 (79.0%),Similarity: 445/563 (79.0%) ,Gaps: 99/563 (17.6%), Score: 1958.0 在核酸比对中可以看出,相同的罚分标准下,water比对得分较高,比对的一致性、相似性更高,引入的空位更少。 蛋白质比对中,Needle比对结果和water比对结果存在差异: Water: Length: 89,Identity: 68/89 (76.4%),Similarity: 84/89 (94.4%), Gaps: 0/89 ( 0.0%),Score: 390.0 Needle: Length: 93,Identity: 68/93 (73.1%),Similarity: 84/93 (90.3%),Gaps: 4/93 ( 4.3%),Score: 390.0 在蛋白质比对中可以看出,相同的罚分标准下,虽然water和needle得分相同,但是water匹配长度比needle短,一致性,相似性更高,没有引入空位。 造成上述差异的原因是,needle进行的是序列的全局比对,而water进行的是序列的局部比对。Needle比对时,会尽可能使2个序列在全序列长度上排列比对,而water比对时尽可能使序列局部达到最优比对。因此,更多时候,局部比对比对的匹配性更好,因此在相同的罚分标准下得分比全局比对更高。 选择两条序列使用MegAlign进行全长比对,比对结果设置为红色突出显示匹配字符。再将序列选择部分区域进行比对(通过faeature table选择(需要Genbank格式序列)或通过坐标coordinate选择(Fasta格式序列即可)),设置对比结果为匹配字符绿色,错配字符红色,用蓝色竖线表示一致序列,不显示标尺。 答:选取的两条序列分别为: gi|315221156|ref|NM_002964.4| Homo sapiens S100 calcium binding protein A8 (S100A8), mRNA gi|113930764|ref|NM_013650.2| Mus musculus S100 calcium binding p

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档