文档,信息检索基础知识.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索基础知识(二) 同济大学图书馆:刘玉红 阅读 • 理想国 ,想象另一种可能:致力于人文、思想、艺术类图书的出 版,并从事文化活动的策划组织,影视作品与文创产品的开发,是一 个活跃而富影响力的文化机构。广西师大出版社北京贝贝特公司推出 的全新文化品牌。猜猜下面作者都是谁?看过哪些书? • 1.4 信息检索原理及过程 1.4.1 信息检索基本原理 • 一.信息检索基本原理 • 信息检索:信息检索包括信息的存储(Storage )和检索 (Retrieval )两方面,即包括将信息按一定的方式组织存 储起来和按信息用户需求来查找出相关信息两方面。 • 信息存储 :指工作人员将大量无序的信息集中起来,根据 信息源的外表特征和内容特征,经过整理、分类、浓缩、 标引等处理,使其系统化、有序化,并按一定的技术要求 建成一个具有检索功能的工具或检索系统,供人们检索和 利用。 • 信息检索 :运用编制好的检索工具或检索系统,查找出满 足用户要求的特定信息。 1.4.1信息检索的基本原理 个与 外 人问 需求 特征化 特征化 部 知题 集合 表示 表示 知 识 识 匹配与选择 1.4.1信息检索的基本原理 匹配运算 用户提问 数据库 命中情报 1.4.2 文献信息的存储 • 文献信息的有序存储是实现文献检索的前提条件。 • 文献信息的存储:对大量的文献进行选择、收集、归类、 整理,把每篇文献的特征信息提取出来,组成该文献的线 索,或称为一个记录,在广泛积累的基础上,根据实际需 要,编制成检索工具或数据库。 • 文献特征信息: • 内容特征:反映文献论述的内容 • 分类号 • 主题词 • 外部特征:题名(标题)、著者、文献出处等 1.4.2存储范例 • 题目:大数据时代的数据引证研究:进展与展望 • 来源:中国图书馆学报 , • 【作者】 侯经川 方静怡; • 【机构】 华东师范大学商学院信息学系; • 【摘要】 随着大数据时代的来临以及数据密集型科学研究 范式的兴起,“数据引证”问题日益受到关注。 • 【关键词】 数据引证; 知识计量学; 大数据; 数据密 集型科学; • 【分类号】G350;G301 1.4.2记录(record) • 一条文献信息称作1条记录(record ) • 一种文献特征信息就是一个字段,每条记录 均由若干字段组成 。 • 上述这条记录共包含了几个字段(field ) • 字段越多,提供的文献信息越详细,那么检 索入口就越多。 1.4.3信息检索语言* 检索语言定义: 是为沟通文献标引与文献检索而编制的人 工语言,也是连接信息存储和检索两个过程 中标引人员与检索人员双方思路的渠道,是 用于文献标引和检索提问的约定语言。 用规范化语词描述文献的内容及外表特征。 检索语言的类型划分 : A :分类语言 • ——是用分类号来描述文献内容特征的一门 语言 • 杜拉拉升职记/李可著 I247.57 • 《我不是教你诈》刘墉

文档评论(0)

boss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档