- 1、本文档共113页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业论文毕业设计开题报告论文报告设计报告可行性研究报告
第五章
生物信息学信息资
源检索的常用工具; 目 的
掌握常用生物信息学的搜索工具,
熟悉理性网络中寻网站、求知识。;Internet世界是一个浩瀚无边、深奥莫测的信息海洋。
网上可索引的网页数量已超过30亿,在呈爆炸性增长。若要逐个登录站点方式进行信息查询,如“大海捞针”。
网上的信息高度复杂,形形色色,多种多样,真假难分。
如何迅速、准确到达目的网点获得所需信息?;网络资源的特点(与传统数据库相比);问题的提出:
信息海洋中如何捞金针?
茫茫雪原上怎样挖雪莲?
无际沙漠内能够找甘泉?; “工欲善其事,必先利其器”,选择恰当的检索工具,对于获取网上信息可取得事半功倍的效果。;1990年三名学生开发一可以用文件名查找文件系统,可搜索的FTP文件名列表。搜索的祖先
1993年开发了一个Gopher搜索工具
1994年4月,斯坦福大学两名博士生,美籍华人杨致远和David Filo共同创办了Yahoo, Yahoo!--几乎成为20世纪90年代的因特网的代名词。
1995年,一种新的搜索引擎形式出现——元搜索引擎
1995年底AltaVista登场亮相
1998年10月Google改变了搜索引擎的定义;1. 搜索引擎(Web Search Engines)定义:
允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。; 2. 数据组织:建立索引数据库
利用索引软件将采集的网页信息进行标引,整序、组织,并建立索引数据库。
不同的索引软件处理数据有明显差异,有的索引软件只标引网页的地址、篇名、特定关键词等内容,有的索引软件则对网页全文进行处理。
数据库的内容必须不断补充、更新,以满足网络信息的不断变化。; 3. 数据检索:在索引数据库中搜索排序 根据用户提出的查询要求,应用查询软件在索引数据库中检索符合条件的网页记录,将检索结果按相关度进行排序,运行后将查询结果返回给用户,获取所需信息。
当输入关键词,搜索系统程序从网页索引数据库中找到符合关键词的所有相关网页。针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。 ;搜索引擎三段式工作流程;搜索引擎系统流程 ; 介绍几种常用、综合性和重要的
专业性搜索引擎。;概述 因特网上目前仅检索工具就有10 000余种,这些工具有不同类型。
本栏目提供一些网上常用的搜索引擎。
Google,Yahoo, Yahoo!
中国 搜狐 百度 网易
新浪搜索 北极星 常青藤 天网 263搜索引擎
中华网 盖世引擎 悠游 茉莉之窗
Goyoyo Excite ? Lycos ? InfoSeek OpenTex
Index Magellan? HotBot? ; 一、搜索引擎的类型
(一)按检索功能分
常将网络检索工具概称为搜索引擎,搜索引擎包括两种网络检索服务。
* 全文搜索引擎 “FullText Search Engine”
** 目录/指南 “Directory/Guides”;1、全文搜索引擎(Full Text Search Engine )
利用搜索软件定期对网络资源进行搜索,然后自
动排序和索引,从而组成一个庞大的信息数据库,并
不断更新。
用户通过访问这些站点,输入关键词或短语等
进行检索, 数据库将与这些关键词相关的网页地址
的超链接信息迅速返回用户。这种方式构成的数据库
不需要人工干涉,数据库庞大,查全率较高,但查准
率较低。
AltaVista就是其中比较著名的一个搜索引擎,
此类查询方式称为“语词查询”或“全文索引查询”。; 2. Web目录/指南(Web directory/guides)
采用人工干预, 将各站点按内容划分为不同
主题大类,再将大类细分为小类,最终建成一个
树状结构的多级分层目录,检索时只要点击它的
树状结构的顶层,即可逐层展开,直到查到所需
信息。Web目录在信息采集、编排、HTML编码等方
面由人工编制和维护,因而数据库收集的页面有
限,但查准率较高。
世界著名的Yahoo就是最早的一个Web指南站点,
也有人将此类查询称为“分类查询” 或“专题查询”。
目前网上流行
文档评论(0)