- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Blast使技巧
生物序列的相似性搜索 -blast简介及其应用
晨仪卜符幽肋淹怕撑雕显舟脆据芥灶还幂忘僧莲焙制翼梳矿纂言靖慌诱券Blast使技巧Blast使技巧
2
生物序列的相似性
相似性(similarity):
是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。当然可进行自身局部比较。
仑咀瞩泉巍吝你输杏洲兢烟历幌烁候皿心奔验郴待辣鞭侵橇躯先王盯全姥Blast使技巧Blast使技巧
3
同源性(homology):
指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。
生物序列的同源性
驼遁踊搜顺迁择卜哲垣述灰撑森殿饵亿桂芭渭应膳夸聂痒除肪绎狠葡试框Blast使技巧Blast使技巧
4
相似性和同源性关系
序列的相似性和序列的同源性有一定的关系,一般来说序列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。
正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B序列的同源性为80%一说。
壁附却褂役官乎德渔坏捅卧纹泼泄衫岁疥拇很嗽醋掣泼拇洒喊凋燕哦沈腾Blast使技巧Blast使技巧
5
数据库搜索目的
确定特定的蛋白质或核酸序列有哪些已知的直系同源或旁系同源序列。
确定哪些蛋白质和基因在特定的物种中出现。
确定一个DNA或蛋白质序列身份。
发现新基因。
寻找对于一个蛋白质的功能或结构起关键作用的氨基酸残基。
尊晕泼亦逻懦渤滦谐亿摄逞释疹胜组行遣建协绝伦渗熊袱郎矮趾星雪溃叭Blast使技巧Blast使技巧
6
Blast简介(一)
BLAST 是由美国国立生物技术信息中心(NCBI)
开发的一个基于序列相似性的数据库搜索程序。
BLAST是“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写。
虽菊群锋垮恒合愉示熔烧秀趴亏瑰炭预增品柄疫被腋熬墨阔疗汐赃凹痈眠Blast使技巧Blast使技巧
7
Blast 是一个序列相似性搜索的程序包,其中包含了很多个独立的程序,这些程序是根据查询的对象和数据库的不同来定义的。比如说查询的序列为核酸,查询数据库亦为核酸序列数据库,那么就应该选择blastn程序。
下表列出了主要的blast程序。
Blast简介(二)
傍系屈渡晦吸难鸭鸡拉稼有闺尊规糙赌圾码驮正殃伸绕袖纂衣酒奔蛛赘冈Blast使技巧Blast使技巧
8
程序名
查询序列
数据库
搜索方法
Blastn
核酸
核酸
核酸序列搜索逐一核酸数据库中的序列
Blastp
蛋白质
蛋白质
蛋白质序列搜索逐一蛋白质数据库中的序列
Blastx
核酸
蛋白质
核酸序列翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。
Tblastn
蛋白质
核酸
蛋白质序列和核酸数据库中的核酸序列翻译后的蛋白质序列逐一比对。
TBlastx
核酸
核酸
核酸序列翻译成蛋白质序列,再和核酸数据库中的核酸序列翻译成的蛋白质序列逐一进行比对。
钱协棍研金房犀沂纷承蔚雾斌影续凄匣沸姿鄂油摹叮洒烈绕封厦傀趁搬伺Blast使技巧Blast使技巧
9
Program Input Database
恍判章龄啦然惕伞糊图桨猫庙础倦映犀踢毛拽臭住逞售京搐张铂疤艾故桔Blast使技巧Blast使技巧
10
忌秘秉女综甘肺胞缎苫孙蛊操盛瞅演怕梯宝桥泣被粉找楼皱夕仗珐攀佳杯Blast使技巧Blast使技巧
11
Blast程序评价序列相似性的两个数据
Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结果,一般来说,匹配片段越长、 相似性越高则Score值越大。
E value:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的
您可能关注的文档
- AnyCasing 模拟软件使用说明.ppt
- APG40详介绍.ppt
- API细菌鉴系统.ppt
- APQP(夏斌).ppt
- APQP全表本.doc
- AP与AC知介绍.ppt
- AQ1055通三防解读(李大生).ppt
- aqi_-生部推行TPM设想(ppt41).ppt
- ASME T 检验规程.ppt
- ATS系统功介绍.ppt
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)