网站大量收购独家精品文档,联系QQ:2885784924

研究生信息检索概论.pptVIP

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

情报检索语言的特点(对比自然语言)壹贰对文献内容加以标引,主题概念表达规范。叁对相同及相关内容加以集中或揭示其相关性。肆对大量情报加以系统化或组织化。伍便于将标识用语和检索用语进行相符性比较。7.2.1医学主题词表常用美国医学主题词表MeSH荷兰医学文摘的主题情EMTree中国中医药学主题词表情报检索语言的特点(对比自然语言)字顺轮排表(索引)1是将主题词表中主题词和入口词按一定顺序(字顺等)排列而成。2入口词:款目词,包括主题词的同义词、近义词、缩略语、不同拼写3方式,倒装或顺装以及已经取消而意义相近的主题词。4树状结构表(范畴表)5将全部主题词按内容分为15个类目,各类主题词按各主题词内涵范围6的大小逐级排列,形成树状结构。7上下位概念:上位词的范围大,下位词的范围小,扩展检索是指某主8题词所有下位主题词标引的全部文献都检出。9组成副主题词(关联词):使用时有明确规定,必须遵循其定义与使用范围。副主题词也有上下位关系,使用时应选择恰当,以提高检全与检准率。01020304检索效率,是概括表示情报检索系统质量的概念,可以说明对情报检索系统各项性能的满意程度。包含检准率(查准率)与检全率(查全率),它们之间的关系是互逆相关的。检全率=检准文献/(检准的献+漏检文献)漏检率=漏检文献/(检准的献+漏检文献)检准率=检准文献/(检准的献+误检文献)误检率=误检文献/(检准的献+误检文献)其他:检索速度、检索方便性与检索成本也是需要考虑的因素。7.2.2检索结果评价手工检索基本上用于对纸质文献的检索。而随着技01术的发展,文献被组织成各类型的数据库,计算机02检索技术也随之成为主流。03文献数据库:是指记录各种文献信息的数据库,计04算机可读、有组织的相关文献信息的集合。在文献05数据库中,文献信息以数字化方式,按一定的数据06结构,有组织地存储在计算机中,使计算机能够识07别和处理。088文献数据库与计算机检索技术 8.1文献数据库类型根据收录性质可分为:文献型、全文型、事实型。文献数据库按内容分: 书目数据库(BibliographicDatabases):存储文 摘、题录、目录等书目数据的一类数据库,又称为 二次文献数据库。 全文数据库(FullTextDatabases):以一次文献 形式直接提供文献全文。 混合数据库:即包含书目记录又包含有全文记录的 文献数据库。其他类型参见教材P3101几种主要的文献数据库P32-3602题录数据库03文摘数据库04图书馆馆藏目录数据库05全文数据库06光盘数据库07多媒体数据库08网络数据库(重要)文献数据库结构01顺排文档:主文档,以文献记录作为信息存储单02元,按文献记录入藏的存取号从小到大顺序排列而03形成的目录式文档,它存储有关于每篇文献的最完04整信息。检索结果的信息来源于顺排文档。例:主05题词索引、著者索引、刊名索引等06倒排文档:就是把记录中一切可检字段或属性值抽07出,按某种顺序重新加以组织后所得到的一种文档.08倒排档从主文档中派生出来,所以,又叫做辅助文档。文档(File)记录(Record)是构成数据库的完整的信息单元,每条记录都描述了一原始信息的外表和内容特征。例:书目数据库中的一条记录通常代表一篇文献。字段(Field)是记录的下级数据单位,用来描述实体的某一属性。例:题名、著者、文摘、主题词等篇名、著者和出处三个字段组成题录。8.2自然语言在计算机检索中的应用 P37-40 不标引方式 文本关键词匹配 单汉字检索方式 自动抽词标引方式: 自动抽词标引 自动赋词标引 自动赋号标引 自动聚类 人机结合抽词标引 自然语言检索应注意的问题用后控制词表弥补各种自然语言应用方式的不足自然语言接口方式以自然语言作为自由词,与情报检索语言并用的方式人工自由标引方式DCBAE关键词索引方式论坛BBS帖子和药品说明书分别属于几次回顾:三次文献是在哪个层次的文献基础上产生的?文献?计算机检索技术全部计算机检索(包括网络检索与数据库检索)的技术基础与技巧。01计算机检索方法与检索途径02检索策略与检索式03检索步骤041.11.21.31.41.51.6布尔逻辑检索位置逻辑检索截词检索字段检索精确检索加权检索125431.1布尔逻辑检索

文档评论(0)

135****7720 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档