信息检索策略总汇.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 拷贝相关页面(按键:Ctrl+Prt Scr) * * 读懂分类表;用检索系统验证…… * 能检出检索词的上下文内容,消除同形异义词,有助于消除主题法选词中的”揣测”成分 运用分类法可灵活进行文献的扩检和缩检,充分发挥检索技能 运用分类法可居高临下,洞察课题在专业学科系统中的定位、上下关系、来龙去脉 通过分类号的引导,有助于对检出文献内容的理解 * * 组合检索亦可直接查阅《中国分类主题词表》 在检索策略中, 若将主题法和分类法的检索思路综合一体, 可使检索式结构简捷、兼备包容性和针对性 * * * * * * 出版商(Publisher) * 示例:查找欧洲投资流向 存在整体与部分的关系:如果用“EUROPE AND INVESTMENTS“去检索,就会有大量文献漏检,原因在于“欧洲”指一个整体地理概念,无法代表通常意义上的英、法等各发达国家 检索时应用:(EUROPE OR BRTAIN OR FRANCE OR ITALY OR SPAIN OR…)AND INVESTMENTS 41941-515 * 41941-515-15 * 王兵兵. 关于利比亚战争的中美新闻发言人语篇的批评性分析[J]. 金田, 2013 (10):259-260. * 也很好地验证了结果 * Censorship propaganda * Hong X. A Comparative Study of the News Photo Coverage of the Korean War in the Chinese and US Press[D]. Pennsylvania State University., 1992. CALIS获取? * * * 中文查准率:5/16=31%;外文查准率:2/30=6% 影响查准率的情况:分析课题缺乏精确性;检索词的专指度较差;检索工具的检索精度较差 * * 刘国慧. 中美新闻政策比较研究[D]. 内蒙古大学: 内蒙古大学,2010. * 疾病-传染病-性病-艾滋病(爱滋病/HIV感染) 影响查全率的情况:采用了不规范的词:大学-高等院校;误用禁用词;所选检索词与检索工具的用词习惯不符;对课题的分析望文生义:西方、西部地区、社会发展状况、产业化、微量元素等;遗漏隐含概念:垃圾处理-垃圾回收、再生等;遗漏了同义词;用户选择不对口的检索工具;检索工具收录范围有缺漏,功能较差;检索途径失误;检索式有缺陷,限定条件过窄;正确的常规方法也会有缺漏。 刘旻, 杨新敏. 把关标准与媒体倾向——人民网与联合早报网美伊战争平民报道比较分析[J]. 新闻与传播研究, 2003, 10(2): 80-86.(新加坡) 通过已经查找到的相关文献获取更多的相关词进行检索,进一步完善检索式 * * * 21世纪马克思主义中国化研究中存在的问题:文献太多,选择经典、有代表性、突破性、专著或核心期刊、核心作者的文献…… * * * * * * 小知识:数据库与电子期刊区别的5个C Current 迟滞与否;coverage 覆盖情况;cost 费用;call host 代为管理;complex 复杂程度。 检索项、检索方式、检索条件…… * * * * 特殊字段:OCLC-人名 * 自然语言是指信息检索系统中使用的标引词直接来自文献和用户提问而不加控制的一类检索语言。 自然语言的应用以计算机为前提,采用后控制技术:对表达主题内容具有实质意义的词语,由计算机通过剔除禁用词(后控词表、禁用词表:冠词、介词、连词、代词、某些动词、高频词等)自动产生关键词。 后控制技术——是指检索系统在标引阶段使用自然语言,不对标引进行严格控制,而在检索阶段才对检索词进行控制的一种自然语言检索优化技术。 主题词表对主题词的规范:对文献检索用语的概念加以人工控制和规范,对同义词、多义词等进行规范化处理,用一个词来表达一个概念,避免多词一义、一词多义、词意含糊 ——同义词/近义词的规范:对完全等同的同义词的规范;对近义词的规范;对学名和俗名的规范;对不同译名、简称与全称的规范——如煤炭-煤;自然资源-天然资源;电脑-计算机;马达-发动机;贫铜矿-低品位铜矿;土豆-洋芋-马铃薯;玉米-corn(英语)-maize(美语)-Zea mays(拉丁文学名);激光-纳米-奈米-莱塞(台湾翻译);世界贸易组织-世贸组织-WTO;X射线-爱克斯射线;弗里昂-弗利昂 ——多义词的规范:限定多义的主题词含义或在特定检索工具规定只有一个特定意义,排除歧义——如Cell(细胞-电池);杜鹃(动物-植物) Y/D/S/F/C 中国分类主题词表 汉语主题词表 * * * 思考:如何提取关键词? * * * * 杜威十進分類法(Dewey Decimal Classifi

文档评论(0)

奇缘之旅 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档