- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京交通大学出版社《信息检索教程》(Information Retrieval Textbook)系列课件 北京交通大学出版社《信息检索教程》系列课件 《信息检索教程》 第2章 计算机信息检索技术编著:刘廷元 本书由刘廷元、邵卫东、汤凝共同编著,具体分工如下:第1章、第2章、第4章、第9章、第5章第1-5节、第7章第4节由刘廷元(西南石油大学)完成;第3章、第6章、第5章第6-8节、第7章第1-3节由邵卫东(安徽理工大学)完成、第8章由汤凝(安徽理工大学)完成。全书的统稿和增删由刘廷元完成。 在编著过程中,借鉴和参考了国内外的许多同类著作、教材和讲义,在此谨向有关作者和出版社表示感谢。 使用中读者如有什么建议,或者本书如果有什么问题,请用邮件与作者联系。 为了方便使用本书,我们编写有配套的电子课件及教学资料素材(包括实习课习题及详解、模拟考试题及答案、课后习题解答。 联系人:E-mail:liuty@ 或liguopingsh@163.com。 1 信息检索的基本概念 1.1 信息检索的涵义 从广义上讲,信息检索包括两个过程, 一是信息存储(information storage),即信息的标引、加工和存储过程: 二是信息检索(information retrieval),即信息用户的查找过程。 从狭义上讲,信息检索仅指后一部分。 信息检索的本质是一个匹配的过程 即用户的信息需求和信息存储的信息集合进行比较和选择的过程 信息存储和检索过程的基本原理 标引 (indexing) 通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献的内容的过程。主要指选用检索语言词或自然语言词反映文献主题内容,并以之作为检索标识的过程。Indexing一词,音译为引得法或意译为索引法,系指索引的编制技术与方法。现代外语辞典中则说明此词有2解,一指索引法,一指标引。 标引是文献加工中的重要环节。 标引的质量,对文献的检索效果有直接的决定性影响。 标识(标志)的词义 标志”与“标识”,在现代汉语中是等价的。 《现代汉语词典》中,【标识】biāozhì 同“标志”。 标识的另类应用:信息创新定义 信息的新定义与标识 传统的信息定义,一直不够完备,关键就是没有更早的启用“标识=标志=表识”这词。传统经典信息定义,加上“标识”一词,马上就升格为,定义的标版。 如,著名维纳的否定式的信息定义(改造前):信息就是信息,信息既不是物质,也不是能量。 改造后,逆维纳信息定义:信息就是信息,信息是物质、能量、信息及其属性的标识。 2002年Dengs原创的信息定义:信息是事物属性标识的集合。 跟随模仿的画蛇定义:信息是事物属性的表征(普适性缩小,添足)。 计算机信息检索是对信息进行收集、分类、标引、著录,并加以有序化组织,将信息储存到计算机存储信息系统中,编制出一个信息检索系统或信息检索工具的过程。 计算机信息检索的基本原理 1.3 信息检索的类型 按信息检索的内容划分 文献检索 数据检索 事实检索 概念检索 (1)、文献检索(Document Retrieval): 根据检索(查找)对象的划分为 文献(信息)检索、事实检索和数据检索。 文献检索主要是利用二次文献进行 ,是信息检索中最基本、最重要的类型。 例:系统收集有关“高强度预应力混凝土管桩承载性能”这就需要我们根据课题要求,按照一定的检索标识(如主题词、分类号等),从所收藏的文献中查出所需要的文献。 (2)、数据检索(Data Retrieval): 是指查找用户所需特定数据的检索。 利用各种词典、手册、百科全书、年鉴、等参考工具书进行检索,也可以利用专门的数据库进行检索。 例:我国第五次人口普查中全国汉民族的人数。 熔点、电阻系数,计算公式、数据图表,化学分子式等。 (3)、事实检索(Fact Retrieval) 是将存储于检索系统中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它回答的问题诸如:“有哪些海外华人得过诺贝尔奖?” 工具:字典、词典(dictionary)百科全书(encyclopedia)年鉴(annual, yearbook, almanac)手册(handbook, manual)名录(biography)和书目指南(directory) 例:第三届全国ITAT教育工程就业职能大赛项目瑞萨超级MCU模型车大赛的比赛,福建工程学院学生的获奖情况。某同类汽车产品中,哪种牌号的销量最大。 练习
文档评论(0)