- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文献检索课件6文献信息检索和原文获取
7 文献信息检索及原文获取;7.1 信息检索基础;(1)什么是信息检索;案例:李开复从30万图片邮件中找出20封邮件(离开微软到GOOGLE)。
方法:把图片转换为文字,再检索。
信息检索(Information Retrieval):依据一定方法,从已经组织好的有关大量信息集合中,查出特定的相关信息的过程。
按照检索对象的不同,可分为文献检索、数值检索和事实检索。
信息检索利用检索词、检索条件实现过滤。;信息检索包括存储和检索两个方面。
A.信息存储的过程
①信息采集:根据一定的规则收集信息。
②信息标引、著录。
对信息的内容特征和形式特征进行揭示和描述。
③编制检索工具或建立检索系统。;B.信息检索的过程
信息存储的逆过程。用户根据信息需求,选取合适的检索词(标题、著者姓名、主题词、分类号等),利用检索工具或检索系统查找出相关信息。
查找的过程实际上是一个匹配的过程,即确定检索词并将检索词与标引词做相符性比较,二者一致,就算找到了符合要求的信息。;(2)信息检索原理;现举例说明信息存储和信息检索的过程。有3篇文献:
文献1:
A Model of multimedia information retrieval
文献2:
The Information retrieval in chemistry WWW server
文献3:
ERIC resources;对3篇文献的内容进行分析,并使用检索语言对其进行标引,标引结果为:
文献1—篇名(title): A Model of multimedia information retrieval
主题(subject): information retrieval, multimedia computer applicatons
文献2—篇名(title): The Information retrieval in chemistry WWW server
主题(subject): chemistry, educational materials
文献3—篇名(title): ERIC resources
主题(subject): educational materials
标引后,这3篇文献分别被存储到数据库。; 如果用户输入“information retrieval”一词,并将检索范围限定在篇名中,则文献1、文献2符合用户要求,成为检索结果。
如果用户输入“information retrieval”一词,并将检索范围限定在主题中,则只有文献1符合用户要求,成为检索结果。
如果用户输入“educational materials”一词,并将检索范围限定在主题中,则文献2、文献3符合用户要求,成为检索结果。
如果用户输入任意其他词汇如“mathematics”,则没有任何检索结果。
这里, “information retrieval”、 “educational materials”等就是检索语言,即具体的检索词,篇名和主题就是检索语言的标识。检索系统就是通过他们将用户需求与信息内容进行匹配运算,最终找到检索结果的。;广义地,信息检索系统是包含了从信息采集到信息检索全过程的服务体系。
狭义地,信息检索系统就是指用户查找信息所使用的检索工具或系统。;(4)信息检索语言;信息检索的实质,就是人们的信息提问与信息的检索标识相比较后决定取舍的过程。一致,就“命中”了信息。不一致,就继续查找。
信息的标识用词和检索用词使用共同的语言来表达。
这种在信息的存储和检索过程中共同使用的语言,就是信息检索语言。又称为情报检索语言、索引语言、标引语言。;自然语言具有多义性
信息检索语言是人工语言,具有唯一性。
信息检索语言对要对一词多义或多词一义的语词进行规范化处理,例如:自行车、单车、脚踏车;鲁迅、周树人。
各种文献分类法,如《中国图书馆分类法》、《国际十进分类法》,以及各种主题词表,如《中国分类主题词表》、《工程索引(Ei)叙词表》等,都是检索语言。;信息检索语言按照其构成原理,可分为
分类检索语言
主题检索语言
代码检索语言;D-1.分类检索语言
①《中国图书馆图书分类法》(简称《中图法》)
②《中国科学院图书馆图书分类法》(简称《科图法》)
③杜威十进分类法(DDC)与国际十进分类法(UDC)
④《美国国会图书馆分类法》(LC) ;依据:毛泽东同志在《整党的作风》中的一段话——
什么是知识?自从有阶级的社会存在以来,世界上知识只有两门,一门叫做生产斗争知识,一门叫做阶级斗争知识。自然科学、社会科学就是这两门知识的结晶,哲学则是关于自然知识和社会知识的
您可能关注的文档
- 教学智慧来自读书及反思.ppt
- 教育教学的案例剖析新.ppt
- 教育科学研究第3讲.ppt
- 教育论文写作17699.ppt
- 散文专题复习[表现手法].ppt
- 散文阅读之主题及形象b.ppt
- 教科书修订情况简介.ppt
- 教育的技术装备统计system.ppt
- 教育技术服务平台使用(家长).ppt
- 散文阅读父亲是1条鱼3.ppt
- 企业级数据治理平台助力国家电网全业务数据中心建设(58页 PPT).pptx
- 2025年春全品作业本七年级语文下册人教版安徽专版答案.pdf
- 2025年春全品作业本七年级历史下册人教版安徽专版答案.pdf
- 2025年春全品作业本七年级语文下册人教版河南专版答案.pdf
- 2025年春全品作业本七年级历史下册人教版陕西专版答案.pdf
- 2025年春英语作业本七年级英语下册人教版答案.pdf
- 2025年春全品作业本七年级历史下册人教版山西专版答案.pdf
- 2025年春全品作业本七年级历史下册人教版河南专版答案.pdf
- 2025年春同步教材解析三步讲堂六年级语文下册人教版答案.pdf
- 2025年春全品作业本七年级道德与法治下册人教版内蒙古专版答案.pdf
文档评论(0)