信息检索铅笔与利用练习题.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索铅笔与利用练习题

信息检索与利用练习题 一、 填空 1. 在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%则全部相关文档有(25)篇。 2. INTERNET是基于(TCP/IP)协议的。 3. 文件ABC.001.TXT的后缀名是(TXT)。文件类型是文本文件。 4. 多数网页采用HTML编写,这里的HTML指的是:(超文本标识语言)。 5. 目录型搜索引擎主要提供(族性检索模式),索引型搜索引擎主要提供(特性检索)模式。 6. 在使用搜索引擎检索时,URL:ustc可以查到( 网址)中带有ustc的网页。 7. 根据索引编制方式的不同,可以将搜索引擎分为(索引型搜索引擎)和(网络目录型搜索引擎)。 8. 按文献的相对利用率来划分,可以把文献分为(核心文献、相关文献、边缘文献)。 9. 定期(多于一天)或不定期出版的有固定名称的连续出版物是(期刊)。 10. 检索工具具有两个方面的职能:(存储职能、检索职能)。 11. 以单位出版物为著录对象的检索工具为:(目录)。 12. 将文献作者的姓名按字顺排列编制而成的索引称为:(作者索引)。 13. 利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为(追溯法),又称为引文法。 14. 已知一篇参考文献的著录为:“Levitan,K.B.Information resourcemanagement.NewBrunswick:RutgersUP,1986,该作者的姓是:(Levitan)。 15. 检索语言可分为两大类:(分类语言、主题词语言)。 16· LCC指的是(美国国会图书馆分类法)。 17. 当检索关键词具有多个同义词和近义词时,容易造成(漏检),使得(查全率)较低。 18. 主题词的规范化指的是(词和概念)一一对应,一个词表达一个概念。 19. 国际上通常根据内容将数据库划分为:(参考数据库、源数据库混合数据库)。 20. 查询关键词为短语DATA OUTPUT,可以用位置算符(W)改写为:(DATA(W)OUTPUT)。 21. 著录参考文献时,对于三个以上的著者,可以在第一著者后面加上(et al),代表等人的意思。 22. 国家图书馆默认的检索方式是(多库检索)。 按检索方法划分,检索工具可分为(手工检索工具)和计算机检索工具。 23. 在使用搜索引擎检索时,(filetype:doc)可以查到(文件类型为doc的文件)。 24. 定期(多于一天)或不定期出版的有固定名称的连续出版物是(期刊)。 25.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为(追溯法或回溯法,又称为引文法或参考文献法)。 26. 小李在某个数据库中检索到了40篇文献,其查准率和查全率分别为40%、80%,则该数据库中全部相关文档有 (20)篇。 27 在计算机信息检索系统中,常用的检索技术主要有逻辑检索、截词检索、位置检索、限制检索等。 28. 根据检索机制不同,可以将搜索引擎分为(关键词检索、分类目录检索)和混合型检索。 29. 广义的信息检索实际上包括文献的__(存储)__和文献的__(检索)__两个相互依存的过程。 30. 搜索引擎由(搜索器)、索引器、(检索器)、用户接口四部分构成。 31. 检索工具具有两个方面的职能:(检索功能、存储功能)。 32. 当检索关键词具有多个同义词和近义词时,容易造成(漏检), 使得(查全率)较低。 33.将记录的特征标识作为排列依据,其后列出含有此标识的记录号的文档称为(倒排文档)。 二、 单项选择 1、使用PING命令探测远方主机时,得到的响应是TIMED OUT,这个信息的含义是:【B】 A. 无法解析DNS B. 连接超时,在指定的时间内,远方主机没有响应 C. 无法识别远方主机的响应信号 D. 其他 2、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】 A. 关键词标题文摘正文 B. 关键词文摘正文标题 C. 标题关键词文摘正文 D. 正文文摘关键词标题 3、关于索引型搜索引擎的采集和索引机制,错误的说法是:【B】 A. 采用网页采集机器人robot,循着超链接不停采集访问到的页面 B. 网页采集机器人可以采集到所有的页面 C. 自动提取网页中的关键词建立索引 D. 网页的更新有一定的周期,有时候存储的网页信息已经过时 搜索含有data bank的PDF文件,正确的检索式为:【A】 A. data bank+filetype:pdf B. data and

文档评论(0)

186****0772 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档