- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章信息检索基础理论
第3章 信息检索基础理论 3.1 信息检索的概念与类型 3.1.1 信息检索的概念 从广义的角度讲,信息检索包含信息存储和信息获取两个过程。信息存储指通过对大量无序信息的选择、收集、著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。 狭义的信息检索是指广义的信息检索的后一个过程,即信息获取的过程,相当于人们说的“信息查询”或“信息查找”。 3.1 信息检索的概念与类型 3.1.2 信息检索的类型 按检索内容区分,信息检索可以分为 文献信息检索:以文献作为检索对象的信息检索,可分为书目检索和全文检索 数据信息检索:以数值或图表形式表示的数据为检索对象的信息检索 事实信息检索:以从文献中抽取的事项为检索内容的信息检索 3.1 信息检索的概念与类型 3.1.2 信息检索的类型 按检索方式区分,信息检索一般分为 手工检索 :以人工利用印刷型的检索工具与工具书来查找文献线索和文献信息的检索方式 计算机检索 :是利用计算机和一定的通信设备查找所需信息的检索方式 3.2信息检索原理 3.2信息检索原理 3.2.1 信息存储 信息存储的工作内容,主要是由标引人员通过对原始文献的阅读分析,对文献中的信息进行鉴别、提炼和浓缩。并采用特定的方式予以整理、保存 1. 收集文献。 2. 文献的内容分析。 3. 信息标引。 4. 信息检索工具的编制。 3.2信息检索原理 3.2.2 信息检索 信息检索的工作内容,主要是接受用户的信息需求后,对信息需求进行细致的主题分析,提炼出用户检索的主题概念,编制出相应的检索策略。 1. 用户提问。 2. 需求的概念分析。 3. 词汇转换。 4. 检索的实施。 3.3检索语言 3.3.1检索语言的概念 传统的检索语言是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。 近年来,随着计算机技术的发展和人们认识的深入,检索语言的概念也发生了变化。自然语言,人们交流时使用的语言,不受任何限制,更符合用户日常表达的习惯,越来越多地应用到网络信息的存储与检索上,并且取得了极大成功。 3.3检索语言 3.3.2 检索语言的种类 分类语言:用分类号来表达各种概念,将各种概念按学科性质进行系统排列,从而形成能充分体现事物的从属、平行、派生关系,包括: 体系分类语言:中图法 组配分类语言 混合分类语言 3.3检索语言 3.3.2 检索语言的种类 主题检索语言 :以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献,包括: 关键词语言 标题词语言 单元词语言 叙词语言。 3.4 检索技术 3.4.1 布尔逻辑检索 布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法 逻辑“与” 逻辑“或” 逻辑“非” 3.4 检索技术 3.4.2 截词检索 截词检索是利用检索词的词语或不完整的词形查找信息的一种检索方法 右截词检索(前方一致) 左截词检索(后方一致) 中间截词检索 3.4 检索技术 3.4.3 位置检索 通过位置运算符来规定和限制检索词之间的相对位置 相邻位置算符有:(W)、(nW)、(N)、(nN) 同字段检索符 同句检索符 3.4 检索技术 3.4.4 加权检索 用一定的数值来表示他们的重要性,这就出现了定量检索技术——加权检索。加权检索的基本方法就是在检索时赋予每个检索词一个表示其重要程度的数值,即“权值”。 词加权检索 词频加权检索 3.4 检索技术 3.4.5 其他检索技术 1. 嵌套检索 2. 短语检索 3. 区分大小写 4. 限制检索 5. 多媒体检索 3.4 检索技术 3.4.5 其他检索技术 1. 嵌套检索 2. 短语检索 3. 区分大小写 4. 限制检索 5. 多媒体检索 3.5 信息检索的方法及步骤 3.5.1 信息检索的方法 1. 常用法:指利用成套的检索工具检索文献信息的方法,可分为 顺查法:是指以课题研究的起始年代为起点,由远及近(由过去到现在),利用检索工具逐年进行查找,一直查到近期为止。 倒查法:是指由近及远(由现在到过去),逆着时间的顺序利用检索工具进行文献信息检索的方法 。 抽查法:是针对有关学科专业的发展特点,根据检索的要求,重点抓住学科、专业发展兴旺、文献发表数量较多的年代,抽出一个或几个时间段进行逐年的查找 3.5 信息检索的方法及步骤 3.5.1 信息检索的方法 2. 追溯法:也称为回溯法、引文法,是利用文献末尾所附的参考文献或引用文献,由近及远(由现在到过去)地进行追踪查找。 3. 循环法:是综合常用法和追溯法的检索方法,即在查找文献信息时,即先利用检索工具查出一定时期内的一批有用的文献,然后依据这些文献后所附的参考文献,进
您可能关注的文档
- 2005年教师优惠套餐.doc
- Module4Unit3公开课课件.ppt
- WAF部署拓扑汇总.ppt
- 数列求和(含答案).doc
- 孝感麻糖品牌推广.ppt
- 中国近代大师与大学(二).ppt
- 论多媒体实用技术之Flash基础.doc
- 网站商业计划书格式与提纲.doc
- 三角与函数期末基础训练.doc
- 财产保险公司车险理赔服务指标季度.doc
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)