- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章计算机信息班检索技术
《信息检索教程》第2章 计算机信息检索技术 1 信息检索的基本概念 1.1 信息检索的涵义 从广义上讲,信息检索包括两个过程, 一是信息存储(information storage),即信息的标引、加工和存储过程: 二是信息检索(information retrieval),即信息用户的查找过程。 从狭义上讲,信息检索仅指后一部分。 信息检索的本质是一个匹配的过程 即用户的信息需求和信息存储的信息集合进行比较和选择的过程 信息存储和检索过程的基本原理 标引 (indexing) 通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献的内容的过程。主要指选用检索语言词或自然语言词反映文献主题内容,并以之作为检索标识的过程。Indexing一词,音译为引得法或意译为索引法,系指索引的编制技术与方法。现代外语辞典中则说明此词有2解,一指索引法,一指标引。 标引是文献加工中的重要环节。 标引的质量,对文献的检索效果有直接的决定性影响。 标识(标志)的词义 标志”与“标识”,在现代汉语中是等价的。 《现代汉语词典》中,【标识】biāozhì 同“标志”。 标识的另类应用:信息创新定义 信息的新定义与标识 传统的信息定义,一直不够完备,关键就是没有更早的启用“标识=标志=表识”这词。传统经典信息定义,加上“标识”一词,马上就升格为,定义的标版。 如,著名维纳的否定式的信息定义(改造前):信息就是信息,信息既不是物质,也不是能量。 改造后,逆维纳信息定义:信息就是信息,信息是物质、能量、信息及其属性的标识。 2002年Dengs原创的信息定义:信息是事物属性标识的集合。 跟随模仿的画蛇定义:信息是事物属性的表征(普适性缩小,添足)。 计算机信息检索是对信息进行收集、分类、标引、著录,并加以有序化组织,将信息储存到计算机存储信息系统中,编制出一个信息检索系统或信息检索工具的过程。 计算机信息检索的基本原理 1.3 信息检索的类型 按信息检索的内容划分 文献检索 数据检索 事实检索 概念检索 (1)文献检索Document Retrieval 根据检索(查找)对象的划分为 文献(信息)检索、事实检索和数据检索。 文献检索主要是利用二次文献进行 ,是信息检索中最基本、最重要的类型。 例:系统收集有关“高强度预应力混凝土管桩承载性能”这就需要我们根据课题要求,按照一定的检索标识(如主题词、分类号等),从所收藏的文献中查出所需要的文献。 (2)数据检索Data Retrieval 是指查找用户所需特定数据的检索。 利用各种词典、手册、百科全书、年鉴、等参考工具书进行检索,也可以利用专门的数据库进行检索。 例:我国第五次人口普查中全国汉民族的人数。 熔点、电阻系数,计算公式、数据图表,化学分子式等。 (3)事实检索Fact Retrieval 是将存储于检索系统中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它回答的问题诸如:“有哪些海外华人得过诺贝尔奖?” 工具:字典、词典(dictionary)百科全书(encyclopedia)年鉴(annual, yearbook, almanac)手册(handbook, manual)名录(biography)和书目指南(directory) 例:第三届全国ITAT教育工程就业职能大赛项目瑞萨超级MCU模型车大赛的比赛,福建工程学院学生的获奖情况。某同类汽车产品中,哪种牌号的销量 练习(判断问何种检索类型) 1、世界上有多少篇关于“飞机材料疲劳断裂问题的研究”的文章等。 2、某种型号飞机的体积、机动性能如何? 3、某高速公路有多长? 4、“ title ”的中文含义是什么? 超文本、超媒体 一、超文本(hypertext) 一种全局性的信息结构,它将文档中的不同部分通过关键字建立链接,使信息得以用交互方式搜索。它是超级文本的简称。 二、超媒体是超文本(hypertext)和多媒体在信息浏览环境下的结合。它是超级媒体的简称。用户不仅能从一个文本跳到另一个文本,而且可以激活一段声音,显示一个图形,甚至可以播放一段动画。 Web Internet采用超文本和超媒体的信息组织方式,将信息的链接扩展到整个Internet上。Web就是一种超文本信息系统,Web的一个主要的概念就是超文本连接,它使得文本不再象一本书一样是固定的线性的。而是可以从一个位置跳到另外的位置。你可以从中获取更多的信息。可以转到别的主题上。想要了解某一个主题的内容只要在这个主题上点一下,就可以跳转到包含这一主题的文档上。正是这种多连接性我们才把它称为Web。
您可能关注的文档
最近下载
- 2025年公安招聘辅警考试笔试题及答案.docx VIP
- (完整word)二次函数练习顶点式基础练习题 .pdf VIP
- 2025年公安局警务辅助人员招聘考试笔试试题(附答案).docx VIP
- 2025-2026学年苏科版劳动五年级上册教学计划及进度表.pdf VIP
- 干式变压器技术规范书.docx VIP
- 2025年西藏自治区昌都市护士基础理论知识考试题库及答案解析.pdf VIP
- 工程建设监理收费标准(发改价格2022670号).docx VIP
- 2025年黑龙江省绥化市辅警招聘考试题库及答案.docx VIP
- 操作手册模板【范本模板】.pdf VIP
- 幼儿园角色扮演的重要性和意义.docx VIP
文档评论(0)