网站大量收购闲置独家精品文档,联系QQ:2885784924

文献检索教学课件-02.信息检索原理与技术-合.pptVIP

文献检索教学课件-02.信息检索原理与技术-合.ppt

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 新词,专业术语称为未登录词。也就是那些在字典中都没有收录过,但又确实能称为词的那些词。最典型的是人名,人可以很容易理解句子“王军虎去广州了”中,“王军虎”是个词,因为是一个人的名字,但要是让计算机去识别就困难了。如果把“王军虎”做为一个词收录到字典中去,全世界有那么多名字,而且每时每刻都有新增的人名,收录这些人名本身就是一项巨大的工程。即使这项工作可以完成,还是会存在问题,例如:在句子“王军虎头虎脑的”中,“王军虎”还能不能算词? ??? 新词中除了人名以外,还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题,而且这些又正好是人们经常使用的词,因此对于搜索引擎来说,分词系统中的新词识别十分重要。目前新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。 * 东南大学 法学院 王孔祥老师 2011年的社科基金项目(青年项目) * 3-4 模糊检索 模糊检索,指允许检索词和检索提问之间存在一定的差异,这种差异即“模糊”在检索中的含义。模糊检索中所指的差异往往来自于用户在输入检索提问时的输入错误,如少键入一个字,打错一个字母等等。另一类差异来自某些词汇不同的拼写形式,例如,单复数,“catalog”和“catalogue”。这时检索工具应该能够检索到用正确词汇或其它变形形式标引的结果,而不是简单地告诉“输入错误”或“没有结果”。 * 3-5 概念检索 概念检索,是指当用户输入一个检索词后,检索工具不仅能检索出包含这个具体词汇的结果,还能检索出包含那些与该词汇同属一类概念的词汇的结果。 例如,检索“automobile”时能找出包含“automobile”、“car”、“truck”、“van”、“bus”等任一词汇的结果。 又如,在查找“公共交通”这一概念时,有关“公共汽车”或“地铁”的信息也能随之检得。 在此意义上,概念检索实现了受控检索语言的一部分功用,即考虑到了同义词、广义词和狭义词的使用。至今为止,Excite在概念检索方面取得了比较明显的成就。 * * * 第四节 计算机信息检索流程 信息检索课程目的: 让你以最有效的方法 收集及筛选所需数据 以提高科学研究能力 * 检索课题 主题分析 选择检索系统 选择数据库 确定检索点/词 制定检索式 计算机处理 数据库 索引词典 原文 标引 分析 结果检验 编辑出版 用户 印刷型 缩微型 电子型 N Y * 检索的程序 1、明确检索的目的 2、检索前的准备工作 3、选择检索系统和数据库 4、规划检索程序 5、分析检索结果 * 1、明确检索目的 * 确定检索目的 分析课题,确定检索主题 确定检索的范围:地理、时间段、文献类型等 预期所需文献信息数量 * 课题名称:互联网治理中的国际法问题研究 互联网引发了网络安全、网络隐私、知识产权等各种法律问题。 目前国际上已经有的关于网络治理方面的法律、法规、条款。 * 2、检索前的准备工作 明确学科通用的关键检索词 是否对特定的作者、专家学者的研究感兴趣? 是否有特定的出版机构的文献与你的研究主题相关? 其它? * 检索要求:新、准、全 如要了解科技的最新动态、学科的进展、了解前沿、探索未知,则强调一个新字; 如要解决研究中的具体问题,则要强调一个准字; 如要了解一个全过程、写综述、作鉴定、报成果,就要回溯大量文献,要求检索的全面、详尽、系统,则要强调一个全字。 * 3 、选择检索系统和数据库 掌握数据库资源所覆盖的学科范围 掌握各种数据收录文献的类型 查看数据库的详细介绍和说明 请教专业的图书馆员,介绍检索的最佳数据库 * 检索点与检索词的选择 利用学科通用的关键检索词,从篇名、文摘、正文入手进行检索 已知有关文献的作者,利用检索工具的作者索引进行检索 已知有关文献的书名, 利用书名进行检索 其它 * 4、规划检索程序 * 4 规划你的检索程序 选定检索主题词 建立检索表达式 调整相关设定:年代、类型等 * 选定检索主题词 利用关键词的上下位词、特有名词及同义词,可查阅工具如字典、分类表等获得。 建立检索表达式 使用逻辑算符(AND, OR, NOT) 限制检索条件:作者, 刊物或年代. 调整相关设定 决定检索结果的显示方式:以 日期,相关性排序 * 或 即时检索 以快速方式进行初步检索 如果可能的话,可利用手头已找到一篇及一些评论性综述文献 * 进 行 检 索 * 5、分析检索结果 不满意 满 意 * 不满意 –非目标性结果 →重新檢索 检查检索词的拼写 检查检索词的准确性:查阅词典、字典、词表,删除错误名词 调查被检索的数

文档评论(0)

1243595614 + 关注
实名认证
文档贡献者

文档有任何问题,请私信留言,会第一时间解决。

版权声明书
用户编号:7043023136000000

1亿VIP精品文档

相关文档