网络检索工具.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络检索工具.ppt

网络检索工具 因特网基础知识 网络检索工具基础 搜索引擎实例 网络免费学术或专业信息资源 1. 因特网基础知识 CNNIC最新统计:截至2008年底,我国互联网普及率以22.6%的比例首次超过21.9%的全球平均水平。同时,我国网民数达到2.98亿,宽带网民数达到2.7亿,国家CN域名数达1357.2万,三项指标继续稳居世界排名第一。 1.2 因特网的互联原理 TCP/IP协议——通信的保证机制 IP地址——地址的标识技术 客户机/服务器系统——运作的基本模式 地址的标识技术——IP地址 识别主机的身份证,唯一性 形式:四组小于256的十进制表示。 如:7 北京邮电大学图书馆技术部一台主机。 字符型的IP地址,即域名(DN)域名的地址格式为: lib. jiangnan. edu. cn 主机名 机构名 网络类型 最高域名 常用网络类型代码 com 商业机构 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 1.3 因特网提供的主要服务 环球网(WWW/Web) 电子邮件(E-Mail) 远程登录(Telnet) 文件传输(FTP)等 环球网(World Wide Web) 1990年诞生于瑞士全欧原子物理研究室。 是通过超文本(Hypertext)方式来进行互联网上信息查询的网络工具。 超级链接:通过网页上的关键字、图片等元素在网页、多媒体信息间建立起网状链接 超文本:一种文件格式,将分散于各机器上的文本、图像、声音等文件通过超级链接链接起来。 基于超文本传输协议:http(Hypertext Transfer Protocol) 环球网(World Wide Web) 统一资源定位器(URL,网址) 是信息在网上的地址,用来定位和检索WWW上的文档。 由三部分组成 web服务器域名、文件路径、文件名 例如:/library/ content.htm 博客-你的网络日记 Blog与BBS的区别 Blog集原创文章、评价、链接、网友跟进于一体 BBS没有上下文概念,反复围绕一个问题,但人们经常忘了以前说过什么。 RSS聚合 是在线集成、共享互联网内容,随时获取网页更新信息的一种简易方式(真正简易聚合,Really Simple Syndication)。 网站提供RSS输出,有利于让用户获取网站内容的最新更新。 用户通常在时效性比较强的内容上使用RSS订阅能更快速获取信息。 网络用户可以在客户端借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站更新内容。例:SharpReader 、看天下、 FeedDemon、 NewzCrawler。流行的在线聚合器: Bloglines ;My Yahoo! 2. 网络检索工具基础 且慢,让我先Google一下? 网络检索工具的原理 主要由五部分构成: 数据采集(robot/spider):负责按照一定的方式和要求对网络资源进行搜集,并将搜集到的网页信息经网络传输,存储到搜索引擎的临时数据库中 数据分析与标引(indexer):负责对收集到的网页信息进行分析,从中提取有检索或查询价值的内容——网页关键词、网页的分类类别等,并对关键词进行权值计算; 网络检索工具的原理 数据组织:负责形成规范的索引数据库或便于浏览的层次型分类目录结构 数据检索:负责帮助用户用一定的方式检索索引数据库,获取符合用户需要WWW信息 信息挖掘:负责提取用户相关信息,利用这些信息来提高检索服务的质量。根据用户以前检索行为的学习统计及其登记的信息,信息挖掘模块在个性化服务中起到关键作用 2.2 搜索引擎类型 按工作原理划分 按检索内容划分 按工作原理划分 独立检索工具 主题指南/目录/网站查询(Directory) 由人工采集网站并进行分类,建成树状等级目录.保证了查准率,但查全率降低。 如:ODP(Open Directory Project) 、 Yahoo! 搜索引擎/网页搜索 通过Robot自动跟踪标引软件搜寻网页,自动进行关键词标引,它不需要人工干涉,查全率较高。 如:Google,All the Web 按工作原理划分 元搜索引擎(集成搜索引擎) 自身不采集信息,没有信息库,同时检索多个独立搜索引擎,以统一格式输出结果。信息量大,用时短。Vivisimo、Ixquick、Mama、搜星、万纬搜索等。 按检索内容划分 通用检索工具 是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。 如:Google、百度、 Altavista、ODP、Yahoo! 学术或专业检索

文档评论(0)

kaku + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8124126005000000

1亿VIP精品文档

相关文档