北大情报学考研资料现代信息检索.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索概述 问题: 什么是信息检索?主要有哪些类型? 试分析阐述信息检索的基本原理 信息检索主要经历了哪些不同的发展时期?各时期特点和人们关注主要问题是什么? 信息检索领域主要研究问题有哪些?它主要涉及到哪些相关学科和研究领域? 当前信息检索领域的前沿问题有哪些? 信息检索 广义上是信息存储与检索,是指按照一定的方式组织和存储起来,并能根据用户的需求要找出其中相关信息的过程。因此从本质上,信息检索是一种有目的和组织化的信息存取活动。 “存”:面向来自各种渠道的大量甚至海量信息资源而进行的高度组织化的存储 “取”:要求面向随机出现的各种用户信息需求所进行的高度选择性的查找,并且尤其强调查找的快速与便利。 早期的信息检索分为:文献检索、事实检索、数据检索 文献检索:以文献(包括文摘、题录、全文)为检索对象的一类信息查询活动。是一种“相关性检索”,相关性是指系统不直接解答用户所提出的问题本身,而只是提供与问题相关的文献供用户参考。直接提供用户所需要的 事实检索:针对从文献中提取出来的各种事实(或知识项)所进行的检索活动。 数据检索:针对经过选择、整理、鉴定的各种数据信息。事实/数据检索是一种“确定性检索”,确定性的含义是系统直接提供用户所需要的确切的数据或事实。 当前信息检索出现了新的三分方法:文本检索、数值检索、音频与视频检索 文本检索:以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。是传统(文献)检索方式的延续,目前在信息检索领域仍占据主要地位并不断获得新的发展。 数值检索:针对数值型数据的查询而发展起来的一类较有特色的信息检索活动。数值检索不仅能检索出符合特定需求的数据信息,而且可以在此基础上提供一定的数据运算与推到能力,以及制表、绘图功能。 音频与视频检索:针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。 信息检索的基本原理:对信息资源集合与信息需求集合的匹配与选择 信息资源集合:有关某一领域的、经选择性采集和组织加工的信息集合体。信息资源集合是一种公共知识结构,它可以弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的信息,知识或获取知识的线索,或者提供某种信息区激活人脑中存储的知识。 信息需求集合:众多用户不同形态的信息需求的汇集,早就了信息需求集合的存在。 匹配与选择 匹配机制主要功能是能够把信息需求集合与信息资源集合依据某种相似性标准进行比较与判断,进而选出符合用户需要的信息。 匹配机制至少包含2个要素:匹配标准(即相似性标准)、执行匹配的动因 为了保障信息检索的快速与高效,匹配操作还要求在检索匹配之前,分别对信息资源集合和信息需求进行某种形式化的加工,形成它们的特征化表示。同时,对用户的信息需求也要进行类似的加工处理,即分析需求的内容,提出主题概念或其他属性,并利用与信息资源集合相同的表示系统(即检索语言)来表示需求中所包含的概念和属性,从而得到用户需求的特征化表示结果——提问式。 信息检索主要研究问题:信息检索活动设计信息资源的采集、整理、存储与查找,其研究范围包括了一切与信息存储和检索相关的系统、过程、理论和方法。 信息检索理论:检索语言(分类语言、主题语言、引文语言、代码语言)、检索模型(集合论模型、代数论模型、概率论模型)、标引理论(有关自动标引的理论和方法)、相关性理论(关于匹配标准的理论)、知识组织与表示理论(概念检索、语义检索与推理需要解决的理论问题,设计到知识的形式化表示方法、知识单之间的语义关联和逻辑推理) 信息检索工具/系统:是有序化的信息资源、设备、检索技术和检索方法等组成的有机整体,构成实现信息检索活动的物质基础。主要设计信息检索系统的结构、功能、设计开发、管理运营、应用评价。 信息资源极其收集、加工:目的是建立和形成可供检索服务的各类机读数据库。 检索技术与方法:网络信息自动采集技术、网页超链接分析技术、搜索结果排序技术、元搜索技术以及各种网络挖掘与个性化服务技术 用户研究与检索策略:系统的研制开发、管理维护、功能和服务的扩展,还是系统评价等,离不开用户研究工作。需要研究用户的查询心理,检索需求以及类型、用户查询信息的行为特征等,以便建立用户模型,制定系统等额设计依据、营销方略以及用户培训计划。主要内容包括用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等。 其他密切相关的自动化处理技术:目前研究比较丰富,具体设计到自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互。 相关学科及领域:计算机科学、数学、系统科学、语言学与计算语言学、认知心理学 信息检索的发展历史 手工检索时期:以印刷文献为主要检索对象;以各类文摘、题录和目录型工具书为可利用的主要检索工具;以图书馆的参考咨询部门为开展信息检索负的中心机

文档评论(0)

***** + 关注
实名认证
文档贡献者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档