网站大量收购闲置独家精品文档,联系QQ:2885784924

南开大学24秋学期专升本网络爬虫与信息提取在线作业.docx

南开大学24秋学期专升本网络爬虫与信息提取在线作业.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

南开大学4秋学期专升本网络爬虫与信息提取在线作业

一、单选题(共20道试题,共40分)

1.以下表示请求正常处理的HTTP状态码为

A.200

B.301

C.404

D.500

2.请问按哪个键可以打开Chrome自带的开发者工具()

A.F10

B.F1

C.F11

D.F12

3.Python中线程池map()方法第二个参数是()

A.列表

B.元组

C.字典

D.集合

4.HTTP常用状态码表明服务器上没有请求的资源的是()

A.500

B.503

C.403

D.404

5.网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。

A.robot.txt

B.robot.html

C.robots.txt

D.robots.html

6.PyMongo中逻辑查询表示大于等于的符号是()

A.$gt

B.$lt

C.$gte

D.$lte

7.Redis中往集合中添加数据,使用关键字()

A.sadd

B.add

C.append

D.sappend

8.Redis是一个开源的使用()语言编写

A.ANSIC

B.C++

C.JAVA

D.Python

9.下列说法错误的是()

A.Charles只能截获HTTP和HTTPS的数据包,如果网站使用的是websocket或者是flashsocket,那么Charles就无能为力。

B.有一些App会自带证书,使用其他证书都无法正常访问后台接口。在这种情况下,Charles自带的证书就不能正常使用,也就没有办法抓取这种App的数据

C.有一些App的数据经过加密,App接收到数据以后在其内部进行解密。Charles无法获取这种App的数据

D.对于上述情况,Charles能抓取到经过加密的数据。但是如果无法知道数据的具体加密方法,就没有办法解读Charles抓取到的数据。

10.Scrapy_redis是Scrapy的“()”,它已经封装了使用Scrapy操作Redis的各个方法

A.组件

B.模块

C.控件

D.单元

11.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题

A.s

B.c

C.d

D.r

12.要想让Scrapy结合Redis,应该对Scrapy爬虫请求的调度算法进行修改,以下哪种修改不能完成这一任务?()

A.队列

B.栈

C.上锁

D.优先级队列

13.Python中若定义object=[1,2,3,4,5],则print(object[-4])输出()

A.NULL

B.2

C.4

D.程序报错

14.如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()

A.列表

B.元组

C.字典

D.集合

15.Python写CSV文件需要哪个方法()

A.CSVWriter

B.CsvWriter

C.DictWriter

D.FileWriter

16.浏览器用来记录用户状态信息的数据叫

A.session

B.cookies

C.moonpies

D.selenium

17.在Scrapy的目录下,哪个文件负责存放爬虫文件?()

A.spiders文件夹

B.item.py

C.pipeline.py

D.settings.py

18.lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据

A.etree.tostring

B.etree.convertBytes

C.etree.toBytes

D.etree.convertstring

19.HTTP常用状态码表明服务器内部资源出故障了的是()

A.500

B.503

C.403

D.404

20.一般来说在页面传输登录信息都用HTTP()请求类型

A.GET

B.POST

C.PUT

D.SEND

二、多选题(共10道试题,共20分)

21.下列关于在IOS上配置charles的说法正确的是()

A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。

B.手机和电脑需要在同一个局域网下。

C.HTTP代理可以使用“自动”选项。

D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动

22.MongoDB中获取名字为set1的集合的语句为()

A.database.set1

B.database(set1)

C.database[set1]

D.database{set1}

23.最常见的HTTP请求类型有()

A.GET

B.POST

C.SEND

D.RECEIVE

24.以下HTTP状态码表示服务器没有正常返回结果的是

A.200

B.301

C.404

D.500

25.Mong

文档评论(0)

wenwen52000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档