信息检索模块595课件.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

模块5信息检索信息技术基础

目录CONTENTS任务5.1网络信息资源检索任务5.2常用的中文数据库检索

01PARTONE任务5.1网络信息资源检索

【任务描述】学校举办大学生职业生涯规划大赛,要求参赛同学必须提交一份个人职业生涯规划的PPT文档。参赛选手张晓鸣同学,在备赛过程中发现虽然网上有很多相关PPT可供参考,但是大多数下载资料原文都需要充值或付费,而学校图书馆购买了百度文库,他希望通过搜索引擎直接搜索百度文库来查找有关大学生职业生涯规划的PPT文档。

【任务描述】张晓鸣同学通过搜索需求分析,最终使用百度高级搜索顺利完成PPT资料查找任务,搜索结果页面如图所示。

【任务分析】搜索内容为网络信息资源,选择检索工具为搜索引擎:百度。搜索的关键信息:大学生职业生涯规划、PPT文档、搜索的网站为百度文库。打开百度首页,点击右上角“设置”按钮,选择“高级搜索”进入百度高级搜索页面。填写“包含全部关键词”对话框,设置搜索内容。通过“文档格式”选项卡,点击“PowerPoint(.ppt)”按钮,可以设置搜索的网页格式。填写“站内搜索”对话框,限定要搜索指定的网站。

【知识储备】--网络信息资源概述1.网络信息资源概述随着互联网的迅速发展,网络检索信息资源已经成为便捷、高效地获取信息的途径。2024年3月,中国互联网络信息中心(CNNIC)发布的第53次《中国互联网络发展状况统计报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网普及率达77.5%,形成了庞大、生机勃勃的数字社会。

【知识储备】--网络信息资源概述(1)网络信息资源的概念和特点①概念:网络信息资源是指以数字资源的形式,将文字、图像、声音、动画等多种形式的信息储存在光、磁等非印刷质的介质中,利用计算机通过网络进行发布、传递、储存的各类信息资源的总和。②特点:数量巨大、增长迅速、形式多样化、传播动态化、共享程度高;质量参差不齐、结构复杂、缺乏质量管理,信息获取的难度增大。

【知识储备】--网络信息资源概述(2)网络信息资源的类型①按照网络传输协议划分,网络信息资源可分为:WWW信息资源、FTP信息资源、P2P信息资源、流媒体信息资源、Telnet信息资源、邮件组信息资源、新闻组信息资源、Gopher信息资源等。②按照信息加工程度划分,网络信息资源可分为:?一次网络信息资源,如博客、个人空间、网络论坛、网络讨论组等实时产生的网络信息。?二次网络信息资源,,如学术数据库、电子图书、学科导航库等。?三次网络信息资源,如百科全书、综述、专题报告等。

【知识储备】--网络信息资源概述(2)网络信息资源的类型③按照信息交流的方式划分,网络信息资源可分为:?正式出版信息资源,如电子期刊、电子报纸等。?半正式出版信息资源,如企业和商业信息、政府机构信息、学术团体信息等。?非正式出版信息资源,如微信、微博、论坛、博客等发布的信息。④按照获取权限划分,网络信息资源可分为:?完全公开的信息资源,所有用户均可使用这一类信息资源。?半公开的信息资源,用户在一定条件下可使用这一类信息资源,比如通过注册并缴纳一定的费用以后可获得相关资源。机密信息资源,这一类信息资源只提供给具有一定权限的用户使用,例如各军事机构和跨国公司通过内部网络交流的信息。

【知识储备】--搜索引擎搜索引擎搜索引擎是一种帮助互联网用户查询网络信息资源的工具,它以一定的规则在互联网上搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务。

【知识储备】--搜索引擎(1)搜索引擎的工作原理①机器人模块从互联网上抓取网页数据②索引模块建立索引数据库③检索模块在索引数据库中搜索排序

【知识储备】--搜索引擎(2)搜索引擎的分类①根据数据检索内容可划分为:综合型:例如,常见的百度、搜狗和Google。专题型:例如:比价购物搜索引擎:;微博搜索引擎:。特殊型:如“SOOGIF中文动图搜索网站:”。

【知识储备】--搜索引擎(2)搜索引擎的分类②根据工作方式可划分为:全文搜索引擎。全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表有谷歌,国内则有著名的百度。目录索引。目录索引是将网站分门别类地存放在相应的目录中。因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。元搜索引擎。元搜索引擎是一种与传统不同的独立搜索引擎,其本身没有搜索引擎的网页搜寻机制,也没有自身独立的索引数据库,而只是定制统一的检索界面,通过调用其他搜索引擎的检索功能来实现网络资源的查询。垂直搜索引擎,又称为专业搜索引擎或专题搜索引擎,是通用搜索引擎的细分和延伸。

【知识储备】--主要的搜索引擎介绍(1)百度

文档评论(0)

一笑倾洁 + 关注
实名认证
文档贡献者

PPT课件

1亿VIP精品文档

相关文档