资料信息化导论 第8讲 信息资源及其利用.pptVIP

资料信息化导论 第8讲 信息资源及其利用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
资料信息化导论 第8讲 信息资源及其利用

第8讲 信息资源及其利用;8.1 信息源及其分类;;;8.1.2 基于加工程度的信息源分类;8.1.3 基于产生时间的信息源分类;信息发现是信息利用的前提。;8.2.1 基于信息载体的信息发现;8.2.2 基于加工程度的信息发现;8.2.3 基于搜集形式的信息发现;8.2.4 数据挖掘;1. 分类分析(classifiers);2. 聚类分析(Clustering);3. 关联分析(Associations);例;进行关联分析;商品X;表8.3为一个零售店中按照顾客号记录的销售数据。这里是按顾客号进行分组的(表8.1中是按交易号进行分组的)。 ;;;信息检索是指根据一定的目的,从信息源中获取符合特定需要的信息的过程。;信息检索总是根据某些线索,即信息的某种外表特征和内容特征来查找、索取信息资料的,这些特征被称之为信息检索的途径。 ;1. 内容特征途径及其工具;(2)主题途径。信息的主题途径以信息内容的主题为检索标识,可以利用的工具有如下几种索引: · 标题词索引:标题词的选用需要具备专指度、通用性何准确性。任何一个标题都是一个完整的标识。 · 关键词索引:关键词是指那些出现在信息源的标题(文献名、篇名、章节名)、摘要、正文中,对表征信息源主题内容具有关键性实质意义的语词。 · 单元词索引:单元词是在概念上不能再分、能用来描述信息源所论及或涉及的主题的单纯词或或合成词,指一个个最小、最基本的词汇单位。 · 叙词索引:叙词也称受控词,是以基本概念为基础,用以概括信息主题的规范化词或词组。目前我国常用的叙词索引工具是《汉语主题词表》。 内容途径的集中性也很强,能将同一主题的分散信息集中到一起。此外,从主题途径检索信息,专指性强,只要找到检索信息的主题,就可以直接按照主题字顺 ;外部特征途径以与附载在信息源上的与内容无关的标识为线索进行检索。这些标识有著者、序号(如ISBN号、专利号、合同号、标准号、报告号、入藏号等)、名称、出版者、出版时间、出版地等。主要的工具有登记号索引、专利号索引、合同号索引、标准号索引、报告号索引、入藏号索引等。;抉择检索方法的目的在于寻求一种花费时间少,查获信息资料全而准的有效方法。;1. 顺查法;2. 倒查法;3. 抽查法;4. ???展法;5. 循环法;8.3.3 信息检索语言;8.3.4 搜索引擎;1. 搜索引擎的种类;(5)垂直搜索引擎。垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。 (6)其他非主流搜索引擎形式: · 集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 ·;;2. 搜索引擎的一般工作原;3. 全文搜索引擎的关键技术;4. 目录索引的关键技术;5. 搜索引擎使用技巧;(4)使用通配符(*和?)。通配符星号(*)表示匹配的数量不受限制,通配符问号(?)表示匹配的字符数要受到限制,主要用在英文搜索引擎中。例如输入“computer*”,就可以找到“computer、computers、computerised、computerized”等单词,而输入omp?ter”,则只能找到“computer、compater、competer“等单词。 (5)使用布尔检索。布尔检索就是使用布尔关系词来决定关键字之间的关系。 · 用and(“与”)连接,表示所连接的两个词必须同时出现在查询结果中,例如,输入“computer and book”,它要求查询结果中必须同时包含“computer”和“book”。 · 用or(“或”)连接,表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如,输入“computer or book”,就要求查询结果中可以只有“computer”,或只有“book”,或同时包含“computer”和“book”。 · 用not(“非”)连接,表示所连接的两个关键词中应从第一个关键词概念中排除第二个关键词,例如输入“automobile not car”,就要求查询的结果中包含“automobile”,但不能同时包含“car”。 · near,表示两个关键词之间的词距不能超过n个单词。 ;(6)使用括号。当两个关键词用另外一种操作符连在一起,而你又想把它们列为一组时,就可以对这两个词加上圆括号。 (7)使用元词检索。大多数搜索引擎都支持“元词”(metawords)功能,用户把元

文档评论(0)

138****7331 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档