数据库的搜索.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据库的搜索

生物序列的相似性相似性(similarity):是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。当然可进行自身局部比较。生物序列的同源性同源性(homology):指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。相似性和同源性关系序列的相似性和序列的同源性有一定的关系,一般来说序列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B序列的同源性为80%一说。序列相似性比较和序列同源性分析序列相似性比较:就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;序列同源性分析:是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;序列1序列2 用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching)序列对位排列(sequence alignment)将两条或多条序列对位排列,突出相似的结构区域两条DNA序列对位排列分析两条蛋白质序列对位排列分析用途分析功能分析物种进化检测突变、插入或缺失序列延长序列定位基因表达谱分析序列对位排列分析的种类序列对库对位排列分析从数据库中寻找同源序列主要涉及核苷酸数据库和蛋白质数据库两序列对位排列分析多序列对位排列分析最流行的序列数据库快速搜索程序 BLASTFastABLAST何为BLAST?——What为何BLAST?——Why何处BLAST?——Where如何BLAST?——How何时BLAST?——When何为BLAST?原文:Basic Local Alignment Search Tool直译:基本局部排比搜索工具意译:基于局部序列排比的常用数据库搜索工具含义:蛋白质和核酸序列数据库搜索软件系统及相关数据库用法:以一个或几个蛋白质或核酸序列为检测序列,搜索蛋白质或核酸序列数据库,寻找与检测序列中一个或多个片段具有较高相似性的一组序列,为何BLAST??使用方便、功能齐全速度快、结果可信NCBI精心维护、持续开发配套数据库不断更新免费服务(NCBI、EBI、TIGR)免费下载,本地安装何处BLASTNCBI - National Center for Biotechnology Information (US)EBI - European Bioinfromatics Institute (EU)TIGR - The Genome Institute (US)Sanger - Sanger Institute (UK)UK-CropNet - The UK Crop Plant Bioinformatics Network (UK)WU-BLAST - Washington University (US)BLAST的搜索策略意译:基于局部序列排比的常用数据库搜索工具用法:以一个或几个蛋白质或核酸序列为检测序列,搜索蛋白质或核酸序列数据库,寻找与检测序列中一个或多个片段具有较高相似性的一组序列,复习:二进位制与十进位制的转换(101.101)2=1×22+0×21+ 1×20+1×2-1+0×2-2+1×2-30.BLAST的操作流程——How(1) Choose the sequence (query)(2) Select the BLAST program(3) Choose the database to search(4) Choose optional parametersThen click “BLAST”NP_006735Step 1: Choose your sequence三种主要的输入方式: 剪切然后粘贴DNA或蛋白质序列使用FASTA格式的序列简单地使用索引号码(如一个RefSeq或GenBank(GI)的序号)。Sequence can be input in FASTA format or as accession numberExample of the FASTA format for a BLAST query一个FASTA格式的序列以一个单行的说明

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档