二是信息检索(information retrieval).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二是信息检索(information retrieval)

4 信息检索的历史 手工检索(1876-1945) 机械信息检索 (1945—1954) 脱机批处理检索(1954-1965) 国际联机检索 (1965-) 光盘检索(1980-) 网络检索(1991--) 后四者统称为计算机信息检索 多种方法并存,网络检索最有发展前景 5 信息检索的模型 浏览型模型 扁平式模型 结构导向模型 超文本模型 基于内容的检索型模型 集合论模型 代数论模型 概率论模型 * 主讲人:许珍 王国硕 网络信息检索与采集 ——检索原理 检索原理 1.信息检索的含义 2.信息检索的种类 3.信息检索的原理 4.信息检索的历史(了解) 5.信息检索的模型(了解) 信息检索基本原理 “图灵实验” 例1.查找书籍 例2.特色库网站 1.信息检索的含义 “信息检索”一词来源于英语“Information Retrieval”,最早见于1950 年国际数学家会议上美国数学家卡尔文·莫尔斯(Calvin Mooers)发表的论文,从1960 年左右开始被美国图书情报界作为专业术语广泛使用。 广义的信息检索 information storage information retrieval 一是信息存储(information storage),即信息的标引、加工和存储过程: 二是信息检索(information retrieval),即信息用户的查找过程。 表示-存储-组织-存取 Representation-storage-organization-access 狭义的信息检索 information retrieval 2 信息检索的种类 1.根据检索手段的不同 Manual retrieval Disc retrieval Online retrieval Web-based retrieval 2.根据检索对象形式 document retrieval(对应:书目型数据库) data retrieval (对应:数值数据库、统计数据库) fact retrieval (对应:指南数据库、全文数据库) 3.根据检索对象 新的三分法:文本检索、 数值检索、音频和视频检 索 按照手段: (1) 传统联机检索; (2)光盘检索; (3)网络数据库检索 检索实时、在线,命令式检索(command search) 检索可单机、联机,菜单式检索(menu search) 利用Internet, 可使用命令、菜单或超链 按检索的对象来划分 例: 某隧道有多长? 世界上最长的隧道是哪条? 海底隧道如何建造? 区别1:数据、事实检索检出文献中的信息本身,文献检索则是检出包含信息情报的文献。 区别2:数据、事实检索是确定性检索,结果可直接利用;文献检索是相关性的书目检索,得到的是相关文献的线索。 3.信息检索的原理 检索的基本原理: 是将用户的检索提问词与数据库文献记录中的标引词进行对比,当检索词与标引词匹配一致时,即为命中,检索成功。 标引的概念(著录) 文献标引是对所收集的文献给出其标识导引,如文献标题、作者名、分类号等。 一次文献→? 主 文档如下(文献及其部分属性举例): 例1:检索作者:C 例2:检索词:知识创新 倒排文档1:作者索引 检索词:用户输入的字、词、字符或短语 检索式:检索提问表达式 检索策略:是对查询的全面策划,在操作上主要指数据库的选择和检索式的编制 前者选择数据库资源,后者实现检索目标 一般也直接将检索式视为搜索策略 信息存储过程包括: ① 文献信息采集,即根据一定的原则收集文献。 ② 文献标引、著录,即对文献的信息特征,包括内容特征和形式(外部)特征进行揭示和描述。其中,对文献内容特征的揭示,主题词表等)对文献主题进行标引,为文献的内容特征加上标识。另外,根据需要,对文献形式特征中有检索意义的项目,如著者、文献题名等也可以做出标引,用做标识是按照系统所采用的信息检索语言(分类表)。 ③ 建立检索系统或编制检索工具。即按标引用语的顺序,将著录的大量文献款目有机地组织成一个排检系统,形成有序的、系统化的检索工具或数据库检索系统。 检索的过程是信息存储的逆过程,即用户对检索课题进行分析,形成检索提问信息,选取合适的检索用语,利用检索工具或检索系统查出相关信息。简单地说,检索就是查找,查找的过程实际上是一个逻辑匹配的过程,即确定检索用语并将检索用语与标引用语

文档评论(0)

yanpizhuang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档