第六章 信息检索复习资料.docxVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索公选课复习资料 信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 会议文献是指在国内外学术或非学术会议上发表的论文或报告。 学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 著录是对文献内容和形式特征进行选择和记录的过程。 数据检索是指特定的数值型数据为对象的检索。 按信息的加工层次分类:(含义) 一次文献:原始文献, 图书、报纸、期刊、会议纪录、专利报告等 二次文献:目录、题录、索引、文摘 三次文献:论文丛集、综述、年鉴 百科全书 一次信息资源 (原始文献): 以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。 二次信息资源(检索工具): 将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。 三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。 二次信息资源与三次信息资源的区别: 对象不同:二次信息资源以“ 篇” 或“ 本” 为单位进行加工; 三次信息资源则归纳了较多的一次信息内容 用途不同: 二次信息资源为检索一次信息的工具; 三次信息资源能直接提供检索答案. 10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。 常用:顺查法???倒查法、抽查法(适用特点、优缺点) 顺查法 从研究课题所需的起始年代作为起点,由远及近查,用于了解某一事物发展的全过程。 优点:系统、全面 查全率高。缺点:费时费力,工作量较大。 适合于复杂的大课题进行全面检索 倒查法 在出版发行时间上由近及远查,重点为近期,在基本上获得所需信息时即可终止检索。 优点:可保证情报的新颖性 缺点:因漏检而影响查全率 多用于查找新课题或有新内容的老课题 抽查法(了解) 专门查找某一段时间的文献。这是利用学科发展一般是波浪式的特点查找文献的一种方法。当学科处于兴旺发展时期,科技成果和发表的文献一般也很多。因此,只要针对发展高峰进行抽查,就能查获较多的文献资料。 追溯法,也称追踪法、扩展法,是以文献末尾所附参考文献为线索进行追溯查询相关原始文献的方法。 综合法,又叫循环法或交替法,是把上述两种方法综合在一起或交替运用的检索方法。 12. 文献检索的途径: 外部特征途径:题名途径、著者途径、序号途径、出版发行者途径。 内容特征途径:分类途径、主题途径 其他途径 1、题名途径,是以文献的名称为线索进行检索的途径,以文献名称(书名、刊名、篇名等)进行迅速查询。 2、著者途径,是以文献责任者名称为检索词进行文献信息检索的途径。责任者包括作者、译者、编者、注释者、文献发布者及专利发明人等。 3、文献序号途径,是以文献的编号为特征进行文献信息检索的途径。文献序号种类很多,有专利号、标准号、报告号、入藏号、合同号、国际标准书号和国际标准连续出版物号等 13. 搜索引擎中,在普通查询词前面加一个filetype表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: / 14. 搜索引擎:是一种能够通过互联网接受用户查询信息指令,向用户提供符合查询要求的信息资源网址的网络信息搜索系统,是建立在传统数据库检索技术的基础上,增加了自动搜索和自动更新数据库信息的功能,并采用人工智能方 法对检索结果进行区分和排序。其搜索系统基本上是自动的,利用网页搜索软件如网络机器人、网络蜘蛛、网络流浪等的自动搜索程序,主动在网页上按某种策略进行远程数据搜索和获取,并生成数据库索引。 15. 检全率=检出相关信息资源量÷系统相关信息资源总量×100% 检全率反映的是检索系统检出相关信息资源的能力 检准率=检出相关信息资源量÷检出信息总量×100% 检准率是反映检索系统排除与检索提问物管信息资源的能力。 一般说,提高检索效果的措施有两项:一是选择质量较高的检索系统;二是提高检索者的检索水平。 查全率高时,查准率低;查准率高时,查全率低。 1

文档评论(0)

0520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档