六信息检索.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
六信息检索

第六章 Internet免费资源的检索与利用 搜索引擎 网络学术资源导航 Internet上的信息资源 误解 Internet无所不包,无所不能,所有信息均可在网上找到;网上找到的信息都是正确的;Internet可以取代其他媒体或信息渠道;网上信息多是非正式、娱乐性信息,缺乏严肃信息,无太多利用价值…… Internet上的信息内容 政府信息;科研信息;教育信息;文化信息;消闲娱乐信息 网上不可能有的信息 不能在网上公开或者让用户自由访问、获取的信息,如:有关企业的发展战略、规划,商业贸易秘密;商业性数据库和大部分有版权的印刷物。 Internet信息的特点 数量庞大,增长迅速 更新频繁、变化无常、分布散乱 良莠混杂 Internet上信息资源的种类 万维网(WWW)信息资源 FTP信息资源 Telnet信息资源 用户服务组信息资源 RSS信息资源 …… Internet上信息资源的种类 按出版类型分 类似印刷型出版物 按是否原创和是否经审核分 原创与转载 正式与非正式出版物 按是否属于搜索引擎检索范围分 可见资源与不可见资源 1:3 Internet信息资源的评价 目的(purpose) 范围(scope) 内容(content) Internet信息内容的评价 准确性 (accuracy) 权威性 (authority) 新颖性 (currency) 独特性 (uniqueness) 可靠性 (reliability) 链接 (links) 图形和多媒体设计(graphic and multimedia design) 信息展示与设计(information presentation and design) 可操作性(workability) 费用(cost) 评论(review) 个人评价方法 从URL中获取信息 一般来自教育(.edu)、政府部门(.gov)、非赢利性机构(.org)的网页学术价值和权威性较高; URL表明该网页来自权威网站,其质量也有保证,等 查看网站首页描述 了解网站主办者名称、联系方式、简介等信息;了解网站的更新情况等 从超链接中获取信息 友情链接、相关链接;反向链接量(可利用Google的“link:URL”实现) 参考他人评价 网络信息检索的一般方法 浏览 偶然发现 顺链而行 利用搜索引擎 利用网络资源指南 虚拟图书馆 搜索引擎 搜索引擎指通过网络搜索软件或网站登录等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询做出响应,提供用户所需信息。 搜索引擎的分类 关键词搜索引擎 在前台提供一个检索入口,用户通过入口提交查询请求(关键词),系统再将检索结果反馈给用户。 如:google、百度 主题分类指南(目录引擎) 依据某种分类标准,建立主题树分层浏览体系,由搜索引擎抓取网上信息之后,对信息进行标引,并将标引后的信息放入各类目下,使这些信息呈现出错落有致的上下位关系。 如:Yahoo、Open Directory() 元搜索引擎 基于搜索引擎的搜索引擎,自身不建数据库,而是在接受用户的查询请求后,访问一个或多个独立搜索引擎的数据库,检索结果是来自独立搜索引擎的检索结果或者结果集合的综合。 如:Metacrawler () 搜索引擎的分类 按语种分 中文搜索引擎 外文搜索引擎 按内容分 门户网站搜索引擎 垂直搜索引擎 使用搜索引擎的注意问题 选择合适的搜索引擎 查具体、特殊问题;查某一类专题或网站信息;查非常专业的内容……按需选择 选择合适的检索词 检索提问的切分;检索词具体化;避免使用禁用词;避免书写错误等等 调整检索策略 检索结果过多或过少的调整 消失网页、网站信息的查找 网页快照;URL地址回溯法;字段检索法 Google 搜索入门 每一个字词都很重要 搜索始终不区分大小写 通常,标点符号等会被忽略 优化搜索结果的一些提示: *保持简单 *使用最可能出现在要查找的网页上的字词 *尽量简明扼要地描述您要查找的内容 *选择描述性的字词 /support/websearch/bin/answer.py?answer=134479 Google基本搜索方法与技巧 准确选择关键词 限制网页语言类型 “相关搜索”功能的使用 缩小搜索范围的常用方法 添加关键词;二次搜索 利用英文双引号精确搜索 利用“-”减除无关资料 利用“|”或“OR”进行“或”搜索 利用site命令指定网域或网站 直接输入拼音关键词进行搜索 利用简繁转

文档评论(0)

ipad0d + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档