《信息检索课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息存储与检索 第五章 网络信息检索 学习目的和要求: Internet概述及网络信息资源利用的一些概念 网络信息资源的特点和类型 网络信息检索工具 Internet作为目前被广泛使用的信息传播工具,已深入人心。Internet是知识经济时代最具发展潜力的大众传媒,它打破时空、地域、经济和文化等因素的限制,形成了别具一格的信息传播方式。它以全新的传播理念不断地更新人们的观念,丰富着人们获取信息的手段。 第一节 因特网信息资源 1.1 概述(1) 对网络信息资源的不同认识: 积极的; 消极的。 网上较丰富的信息内容: - 政府信息 - 教育信息 - 科研信息 - 商务信息 -消闲娱乐信息 1.1 概述(2) 特点: 丰富,覆盖面广,涵盖各学科领域; 超文本、超媒体、集成式地提供信息; 信息来源分散、无序; 没有统一的管理机构,没有统一的发布标准; 变化、更迭、消亡等都时有发生; 无限、无序、优劣混杂。 1.1 概述(3) 更具优越性之处: - 新颖、深入; - 广泛、直接交流; - 非正式、自由; - 价廉。 1.2 因特网信息资源评价(1) 评价的必要性: 网络资源的无限、无序、优劣混杂, 信息过载(information overloaded), 缺乏质量监控导致的信息污染、检索噪音加大, 用户对获取高质量信息的需求迫切。 评价的对象:一般是网页(web page)或网站(website)。 1.2 因特网信息资源评价(2) 评价标准: 目的(purpose);范围(scope) 内容(content):准确性(accuracy)、权威性(authority)、新颖性(currency)、独特性(uniqueness)、可靠性(reliability) 图形和多媒体设计(graphic and multimedia design) 信息的展示与设计(information presentation and design) 可操作性(workability): 用户友好性、检索性能、交互性、连通性等 费用(cost) 信息组织层次 1.2 因特网信息资源评价(3) 评价方法: 定性评价:问卷调查、专家评议 定量调查:数量分析(访问、登录次数,链接数量等)以掌握用户兴趣、网站影响力等。 一般评价: 查看首页描述和更新时间; 阅读帮助文件,了解查找、使用方法; 查看FAQ; 发现有无空链、错链等; 关注各门户或相关网站的推荐站点(站点精选、热门站点等)和调查统计结果:如“中国互联网信息中心(CNNIC)”定期发布的调查统计报告。 第二节 网络信息检索 2.1 概述 开始于20世纪90年代中期 Web迅速成为查找网络信息的主要平台 较低的查准率是网络信息检索方面的突出问题 网络信息检索的特点 信息检索空间的拓宽 交互式作业方式 用户界面友好且操作方便 2.2 网络信息检索的一般方法 浏览(Browsing) 偶然发现(网上冲浪,随意性阅读) 顺“链”而行; 基于目录型网络检索工具(分类目录树)的资源导航,如:Yahoo!或其它专业性网络资源指南 检索(Searching) 利用搜索引擎等网络检索工具,输入关键词、短语、词组等进行检索 2.3搜索引擎(Search Engine) (1)定义 又称搜索机,是网上的导航工具,是一种搜索WWW信息的软件。它是通过采集、标引众多网络站点来提供全局性网络资源控制与检索机制,将全球的WWW网络中的所有信息资源作一完整的集合、整理和分类,方便用户查找所需信息的网络检索软件。 (2)特点 收录、加工信息的范围广、速度快; 检索功能强,一般可称为网络资源的关键词索引; 检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便; 标引过程缺乏人工干预,准确性较差; 检索误差(噪音)较大 搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明确的课题。 (3)分类 搜索引擎不仅数量增长快,而且种类多,目前尚无统一的分类标准。 (1)全文搜索引擎(关键词索引型搜索引擎) 搜索引擎按其工作的方式,主要分为三种: 百度/ Google/ (2)目录索引型搜索引擎 搜狐/ 新浪/ 雅虎/ (3)元搜索引擎 搜星/ 按服务对象和规模分:综合门户搜索引擎、垂直搜索引擎 1全文搜索引擎(关键词索引型搜索引擎) 百度快照——是百度网站最具魅力和实用价值的好东东。 大家在上网的时候肯定都遇到过“该页无法显示”(找不到网页的错误信息)。至于网页连接速度缓慢,要十几秒甚至几十秒才能打开更是家常便饭。出现这种情况的原因很多,比如:网站服务器暂时中断或堵塞、网站已经更改链接等等。无法登录网站的确是一个令人十分头痛的问题。百度

文档评论(0)

maxianhui + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档