20秋广东开放大学数据采集与管理形成性考核真题试题参考答案资料.pdf

20秋广东开放大学数据采集与管理形成性考核真题试题参考答案资料.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
百年教育职业培训中心:/ 广东开放大学 终结性考核 参考资料 百年教育职业培训中心编制 百年教育职业培训中心:/ 百年教育职业培训中心:/ 数据采集与管理(专20 春) 测验1 (10%) 题目 1 不正确 获得 5.00 分中的 0.00 分 未标记标记题目 题干 关于表层网页及深层网页,以下说法不正确的是()。 选择一项: a. 深层网页中包含的信息远远少于表层网页。 b. 深层网页爬虫主要用于爬去因此在搜索表单后的深层网页。 c. 表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主构成的 Web 页面。 d. 深层网页是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词 才能获得的 Web 页面。 反馈 正确答案是:深层网页中包含的信息远远少于表层网页。 题目 2 不正确 获得 5.00 分中的 0.00 分 未标记标记题目 题干 ()又称全网爬虫,爬行对象从一些种子URL 扩充到整个 Web ,主要为门户站点搜索引擎和大型 Web 服务 提供商采集数据。 选择一项: a. 通用网络爬虫 b. 聚焦网络爬虫 c. 深层网络爬虫 d. 增量式网络爬虫 反馈 正确答案是:通用网络爬虫 题目 3 不正确 获得 5.00 分中的 0.00 分 未标记标记题目 题干 对发出的 HTTP 请求应答的服务器上存储着一些资源,比如 HTML 文件和图像。我们称这个应答服务器为 ()。 选择一项: 百年教育职业培训中心:/ a. 用户代理 b. 浏览器 c. 源服务器 d. 播放器 反馈 正确答案是:源服务器 题目 4 不正确 获得 5.00 分中的 0.00 分 未标记标记题目 题干 HTTP 请求中的()方法用于请求服务器回送收到的请求信息,主要用于测试或诊断。 选择一项: a. GET b. TRACE c. PUT d. TRACE 反馈 正确答案是:TRACE 题目 5 正确 获得 5.00 分中的 5.00 分 未标记标记题目 题干 在 HTTP 请求中,通过()方法发送的数据,会放在 URL 之后,以?分割 URL 和传输数据,参数之间以相 连。 选择一项: a. TRACE b. GET c. POST d. PUT 反馈 正确答案是:GET 题目 6 正确 获得 5.00 分中的 5.00 分 未标记标记题目 题干 ()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度 上保证所爬行的页面是尽可能新的页面。 选择一项: a. 增量式网络爬虫 b. 深层网络爬虫 百年教育职业培训中心:/ c. 通用网络爬虫 d. 聚焦网络爬虫 反馈 正确答案是:增量式网络爬虫 题目 7 不正确 获得 5.00 分中的 0.00 分 未标记标记题目 题干 发出的 HTTP 请求由三部分组成,分别是:()。 选择一项: a. 消息报头、请求正文 b. 应答行、消息报头、请求正文 c. 请求行、消息报头、请求正文 d. 请求行、请求正文 反馈 正确答案是:请求行、消息报头、请求正文 题目 8 正确 获得 5.00 分中的 5.00 分 未标记标记题目 题干 GET 提交表单时,以()符号分割 URL 和传输数据。 选择一项: a. ? b. * c. || d. 反馈 正确答案是:? 题目 9 正确 获得 5.00 分中的 5.00 分 未标记标记题目 题干 追求高数据质量是对大数据的一项重要要求,要消除某些数据的不可预测性,去掉一些杂乱”的脏”数据, 就涉及到()技术。 选择一项: a. 数据清洗 b. 数据预测 c. 数据采集 d. 数据统计 反馈 百年教育职业培训中心:/ 正确答案是:数据清洗 题目 10 不正确 获得 5.00 分中的 0.00 分 未标记标记题目 题干 ()的搜索策略是指按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止,比较适合 垂直搜索或站内搜索。 选择一项: a. 深度优先 b. 基于目标特征 c. 基于领域 d. 广度优先

您可能关注的文档

文档评论(0)

153****1683 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档