- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索的查全率和查准率研究
信息检索的查全率和查准率
摘要 针对衡量文献信息检索效果的主要技术指标查全率与查准率,提出了以灵活运用算符为基础的提高查全率与查准率的文献信息检索方法。
关键词 文献检索 信息检索 文献信息 查全率 查准率
文献检索是科研的基本功,阅读文献是科研人员获取科研信息的重要途径。评价文献检索质量的两个最重要的指标是查全率和查准率。查全率指的是检出的相关文献量 与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查全率 = 检出相关文献量 / 文献库内相关文献总量× 100% 。查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。查全率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。查全率与查准率在一定程度上是成反比关系的,为了提高查全率就要以牺牲部分查准率为代价,反之亦然。在不同的情况下,对二者的要求也不同,有时 文献的全面更为重要,这时就要以提高查全率为重点,有时希望找到的文献准确率更高,就以提高查准率为重点。本文讨论的是怎样提高文献的查全率。1 检索词的转换。常见的转换是同义词、近义词、相关词、单复数及缩写形式,如是动词还有可能有不同的时态。每一个检索词都有可能有多种表达形式,如果是由 英文翻译过来的还有可能有多种翻译方法,所以应该尽可能找全检索词的所有同义词、近义词。相关词指的是与检索词不是同一个意思但是有关联的词。 如,META分析的同义词包括元分析、荟萃分析、meta-analysis,近义词包括系统综述,相关词为循证医学。前列腺癌的缩写可能是Pca等等。 值得注意的是,在检索中文文献的时候,有必要把英文的全称和缩写也作为检索词,因为有些中文文章中是直接用英文词汇表示的。2 使用截词符。虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索结果,但是要想做到这一点是相当困难的。这时可以利用截词符来帮忙。一般用的截词 符是“?”和“*”,在不同的数据库中表示的意思有所不同,常见的意思是“?”表示0-1个字符,而“*”表示多个字符。3 使用上位词,即指代范围更广的词。有些检索系统有主题词途径,则可以选用上位主题词。例如水果是苹果的上位词,prostatic neoplasm的上位主题词是prostatic disease。4 改变布尔运算符,即将连接两个或多个检索词的AND改为OR,即可提高检出数量。5 改变检索项。如要求检索词位于标题中或为关键词或主题,检出记录数太少,则可改为要求位于摘要或全文中,检出记录数即可增加。6 减少限制条件,增加副主题词。如果前面的检索中有限制条件,放宽或去掉限制条件;如果采用的是主题词和副主题词搭配的形式,看是否漏掉可能的副主题词。以上说的是在同一个数据库中进行检索。但是,每一个数据库所收录的文献都是有限的,而不同的数据库可能存在一定的互补关系。所以为了提高查全率,应该多检 索几个数据库,将结果综合起来。当然前提条件是要了解每一个数据库收录期刊的范围、起止年代等,因为不排除有些小的数据库完全是另外一个大数据库的子集的 情况,这时当然完全没有必要再检索那个小的数据库了。即使是将目前所有的数据库加起来,也不能囊括所有的文献。例如,有一些年代比较久远的,或者是期刊知名度不高的。所以,除了在数据库中进行检索,还要辅以 手工检索。包括对一些重要的而数据库中没有收录的期刊进行手工检索,在已经查到的文献的“参考文献”中或有些数据库提供的“相关文献”中进行查找,看有无 “漏网之鱼”,还有,可以请教相关 领域的专家,看看是否有重要的文献没有检索到。一般我们检索文献不是英文的就是中文的,对于其它语种的则不做要求。如果是要求查全率很高,则可以检索一些不常用的语种的文献,如日文、法文、德文等等。当然如果自己不会那门语言,即使查到了,阅读也是一个问题。如果真是非常重要,不妨请人翻译过来。一、选择检索工具???
选择恰当的检索工具,是成功实施检索的关键。选择检索工具一定要根据检索课题的内容、性质来确定。主要应从以下几个方面来考虑:(1) 从内容上考虑检索工具的报道文献的学科专业范围。对此可利用三次文献如《国外工具书指南》、《工具书指南》、《数据库目录》等来了解各检索工具(二次文献)的特点、所报道的学科专业范围、所包括的语种及其所收录的文献类型等。
(2) 选择检索工具时,应以专业性检索工具为主,综合型检索工具进行配合、补充。
(3) 在技术和手段上,由于计算机检索系统适应多点检索、多属性的检索,检索精度高,应首选机检工具,而且应选择合适的数据库,目前许多检索系统如DIALOG、OCLC等都提供有从学科范畴选择检索工具的功能,可供用户利用。
如果只有手工检索工具,应选择专业对口,文种熟悉、收录文献光,索引体系完善
您可能关注的文档
- 人教版三年级数学下册第六单元测试题34.doc
- 人教版三年级语文下册第27课卖木雕的少年教案.doc
- 人教版三年级下册数学第六单元试卷.doc
- 人教版九年级语文上册文学常识.doc
- 人教版九年级物理第14章《内能的利用》复习学案.doc
- 人教版二年级数学下册第四单元解决问题教案.doc
- 人教版二年级数学下册第五单元单元测试2.doc
- 人教版二年级数学下册重点.doc
- 人教版五年级下册信息教案.doc
- 人教版五年级下册语文教学计划doc210.doc
- 面向大规模人群的网络化指纹考勤系统:技术、挑战与实践.docx
- 论我国检察权对行政权的有效制约:理论、实践与制度构建.docx
- 车前五仁汤对老年性气血虚型便秘的疗效探究与机制解析.docx
- 动态稳定理论视角下我国证券经纪人流动管理的优化与实践.docx
- 交通银行A分行操作风险管理体系的优化与创新研究.docx
- 中国对东盟国家直接投资:现状、影响因素与发展策略探究.docx
- 电磁轨道炮膛内强磁场屏蔽与磁保险引信样机设计研究.docx
- 区块链赋能电子投票:关键技术解析与应用探索.docx
- 农村信用社小额信贷对农户收入影响研究——以泗洪县为例.docx
- 新疆棉花生产扶持政策的实施成效与农户满意度研究:基于多维度分析视角.docx
最近下载
- 专题01 定语从句100题(考点串讲)(word版有答案).docx VIP
- 凿井井架设计汇编.doc VIP
- 北京某电力隧道工程投标施工组织设计.doc VIP
- 《【阅读专题2】故物与深情:感受血缘中的亲情》教学课件.pptx VIP
- 人教版九年级英语 课文标注笔记 全册.pdf VIP
- 北京某电力隧道工程(投标)施工组织设计.pdf VIP
- 高压旋喷桩技术交底1 - 桩基础.docx VIP
- 17J008 挡土墙(重力式、衡重式、悬臂式)(最新).pdf VIP
- 《【阅读专题1】忠与孝:体会宗法社会的伦理选择之难》教学课件 (1).pptx VIP
- 力普LP100说明书PDF_Image_Marked.pdf VIP
文档评论(0)