- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学-第二章 生物学数据库及其检索.ppt
Entrez检索 全局检索 精确检索 批量检索 My NCBI 全局检索 Global Search (/gquery/) 该检索方法可对检索词进行多个数据库的宽泛检索,但检索结果不精确。精确检索须针对特定数据库采用特殊方法进行查询。 ENTREZ的全局检索页面 精确查询 布尔逻辑表达式: AND OR NOT 限制(limit):包括字段限制、数据库来源限制等;不同数据库限制类型不同 高级检索:可利用搜索构造器进行多词多字段检索,并可利用检索历史进行配合。 通配符使用:“*” 如“hor*” 范围符使用:“:” 时间、序列长度、分子量等。如2005:2012[date] 5000:10000[sequence length] 字段限定 范围限定 PUBMED限制检索页面 蛋白质数据库高级检索页面 批量检索 Batch Entrez(/sites/batchentrez?) 通过上传包含有核酸或蛋白质数据库的GI号或accession numbers的文本文件,一次显示所有查询条目,这对一些高通量数据的查询提供便利。 My NCBI NCBI提供的人性化服务,其功能有: 保存数据 保存检索历史并定期返回检索的新数据(Email) 对检索的数据可自定义过滤选项 (二)SRS SRS 是一种通用的生物信息学数据集成软件系统 SRS使用专有的解析技术,对flat-flie格式数据的解析和索引并与DOM处理结合的另一种类似的系统用于分析和索引XML格式的数据。关系数据库连接器可用于集成关系数据库系统中存储的数据。 SRS的提供了一个获取独特的异构数据源的通用接口以及关联实际格式和数据存储机制的复杂性旁路。 SRS可以不同数据库的参照的文本格式并将其整合成为统一的模式。 SRS检索方法 快速文本检索 批量检索 标准查询 扩展查询 搜索式查询 字段索引查询 快速文本检索 该方法检索词将与检索的数据库中所有字段匹配 ,检索结果精确度较差。 SRS快速文本检索界面 批量检索 List Search 与Batch entrez检索类似; 检索类型须符合DATABASE:ID模式,如:EMBL:AB046566或UNIPROT:104K_THEAN 列举条目不超过500条。 SRS的list search界面 标准查询 检索前须确定一个或多个数据库。有四个检索框并可由布尔逻辑(and ,or,not)进行关联。 检索框中可进行单个词或多个词检索 多词间的布尔逻辑符号为,|,!分别对应and,or,not 对于数字和日期 SRS使用数字化的条目对日期,条目的序列、分子量等长度进行具有针对性的搜索。 Uniprot/swissprot数据库标准查询表单模式 范围操作符 数字化条目可以使用不同的操作符结合到表达式中。这些操作符是:小于;小于或等于;大于以及大于或等于。 以上这些可以通过结合冒号:和感叹号! 来实现。冒号代表不等于,冒号在数字的前或后代表了是大于还是小于。感叹号表示的是在其右边的数字是否被包括在考虑范围内。也就是说感叹号可以被视为“非”或“不等于”。下面是几个简单的例子: 12:15 大于或等于12但是小于或等于15. 12: 大于或等于12,无明确上限。 !12: 大于但不等于12,无明确上限。 :12 小于或等于12,无明确下限。 :!12 小于但不等于12,无明确下限。 正则表达式和通配符应用 正则表达式可用于搜索不同拼写的单词,或者相同词根不同词缀的单词 。如“/^phos/”会找到所有以“phos”开头的词(如phosphate, phosphorylase),“/ase$/”会找到所有以“ase”结尾的词(如kinase, phosphatase)。 使用“*”和“?”通配符 。如,“cell*ase”会找到所有以“cell”开头并以“ase”结尾的词(如cellobiase, cellobiohydrolase, cellulase)。 扩展查询 将查询数据库所有字段列举显示出来,并可应用标准查询中的检索框检索的所有功能。 范围检索可直接用下拉菜单中选取操作符。 查询展开式显示使用下拉菜单完成数字类型数据的设置。 搜索式查询 在“查询结果”页面,在“运用搜索式查询”文本框中输入你要查询的内容。点击检索键。例如,搜索同时符合两项查询Q1和Q2的结果,可以输入Q1Q2。这会产生一个新的列表Q3,它包含所有同时存在于Q1和Q2列表中的条目。如果你想在查询结果Q3
文档评论(0)