- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章数据库查询和数据库搜索讲述
第五章 数据库搜索 简介 数据库查询(database query) 对序列、结构以及各种二次数据库中的注释信息进行关键词的匹配与查找 数据库搜索(database search) 通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列 二者区别 主要操作对象:注释信息/序列信息 采用方法手段:关键词匹配/序列比对 主要目的及结果:查找包含注释信息的所有条目/查找具有一定相似性的序列信息 数据库查询系统Entrez 相关背景知识 由NCBI开发,是一个为用户提供访问序列、定位、分类和结构数据的搜索和检索系统 可提供序列和染色体图谱的图形视图 集成了NCBI各种数据库中的信息 提供丰富多样的搜索方式 除了提供数据查询外,还提供生物分子数据分析工具(ORF Finder) 涉及的数据库 PubMed 生物医学文献Medline检索 GenBank 核酸序列数据库 Proteins 蛋白质序列数据库 Structures PDB三维结构数据库 Genomes 基因组数据库 OMIM 人类基因和遗传疾病的分类数据库 Taxonomy 系统分类数据库 LocusLink 基因信息数据库 PopSet 种群亲缘关系核酸序列对比数据库 Entrez特点 使用方便 将序列、结构、文献、基因组、系统分类等不同类型的数据库有机地结合在一起 有机结合了数据库和应用程序 链接的数据库丰富多样(文献数据库、序列数据库、结构数据库、基因组数据库、系统分类数据库), “Related sequence”工具,可直接找到与查询所得蛋白质序列同源的其它蛋白质。查询得到的蛋白质三维结构,还可通过Cn3D软件直接显示分子图形 交叉索引查询 通过超文本链接,用户可从一个数据库直接转入另一个数据库,方便在数据库之间进行数据挖掘 支持模糊查询 使用方法 进入NCBI主页:www.ncbi.nlm.nih或/entrez 在search条中选定数据库,for条中输入关键词,单击“Go” 单击“About Entrez”,进入Entrez帮助页面 单击“Entrez Tutorial”进入联机学习,Entrez将以查询人类基因为例,介绍各种数据库的查询方法,使用户熟悉Entrez的使用方法(pdf文件) Entrez其他功能 Limits:限定字段查询,只在给定范围内查找。不同的数据库,可限定的范围不同 Preview/Index:预检索/索引检索,只列条目,不列明细 History:查看历史纪录 Clipboard:将查询结果复制至剪贴板,便于后面使用 Details:查看检索结果的详细内容 数据库查询系统SRS Sequence Retrieval System 相关背景知识 由欧洲分子生物学实验室(European Molecular Biology Lab, EMBL)开发 开放的数据库查询系统,即不同的SRS查询系统可根据用户需要安装不同的数据库 网站地址: http://srs.embl.de/srs/ (EMBL服务器) http://srs.ebi.ac.uk/ (EBI [欧洲生物信息研究所] 服务器) http://www.lionbio.co.uk/publicsrs.html (列出了全世界各地SRS服务器的url地址) 可通过多种途径进行检索(名称、分类等级、序列等) EBML SRS服务器界面 华南理工大学SRS服务器界面 SRS主要特点 统一的用户界面 安装通用网络浏览器即可查询世界上各地SRS服务器上的300多个数据库 高效的查询功能 建立数据库索引文件,可快速高效实现查询,并可以某次查询结果为子数据库进行进一步查询 灵活的指针链接 超文本指针链接 方便的程序接口 可将序列分析等应用程序嵌入至基本查询中,做进一步分析及处理 开放的管理模式和统一的开发平台 数据库以文件系统的方式进行存放,便于更新和二次开发 使用方法 进入SRS主页:http://srs.ebi.ac.uk/ (EBI服务器) 在Find条中选定数据库类型nucleotides(核苷酸),matching条中输入关键词BRCA1(乳腺癌易感基因),单击“Search” 出现搜索结果,包括该基因的登记序列号、长度、摘要性 描述、首次登记时间、最后更新时间、相关文献/摘要、碱基对序列等 数据库搜索相似序列 数据库搜索的基础是序列的相似性比对,即双序列比对(pairwise alignment),主要目的在于寻找同源序列 同源序列(homology sequence):指从某一共同祖先经趋异进化而形成的不同序列。 检测序列(probe sequence):新测定的、希望通过数据库搜索确定其性
文档评论(0)