- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
19春学期(1709 、1803、1809、1903)《网络爬虫与信息提取》在线作业-0002
试卷总分:100 得分:0
一、 单选题 (共 20 道试题,共 40 分)
1.Python操作CSV文件可通过()容器的方式操作单元格
A.列表
B.元组
C.字典
D.集合
正确答案:C
2.以下哪个HTML标签表示分区或节()
A.
B.
C.
D.
正确答案:A
3.Python中若定义object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A.12
B.123
C.23
D.234
正确答案:C
4.Redis中读取数据语句lrange chapter 0 3,那么表示读列表中()个值
A.2
B.3
C.4
D.5
正确答案:C
5.HTTP常用状态码表明服务器正忙的是()
A.500
B.503
C.403
D.404
正确答案:B
6.MongoDB中可以将()数据结构插入集合中
A.列表
B.元组
C.字典
D.集合
正确答案:C
7.Redis中查看一个列表长度,使用关键字()
A.len
B.length
C.llen
D.count
正确答案:C
8.网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。
A.robot.txt
B.robot.html
C.robots.txt
D.robots.html
正确答案:C
9.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A.scroll_forwad
B.scroll_up
C.scroll.forward
D.scroll.vert.forward
正确答案:D
10.在Python中,为了使用XPath,需要安装一个第三方库()
A.lxml
B.xml
C.xpath
D.path
正确答案:A
11.下列关于mitmproxy的安装说法错误的是()
A.对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxy
B.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python 3.5或者更高版本
C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装
D.UBUNTU中执行命令 sudo pip3 install mitmproxy 进行安装
正确答案:C
12.Redis中从集合中查看有多少个值,用关键字()
A.scard
B.card
C.count
D.distinct
正确答案:A
13.requests获取get或者post请求后需要通过()属性获取文本内容
A.content
B.text
C.string
D.body
正确答案:A
14.查看网站请求一般在Chrome开发者模式下的()选项卡中查看
A.Console
B.Sources
work
D.Performance
正确答案:C
15.某些网站在发起Ajax请求时会携带()字符串用于身份验证
A.Token
B.Cookie
C.ReqTime
D.sum
正确答案:A
16.Redis中往集合中读数据,使用关键字()
A.pop
B.spop
C.lpop
D.range
正确答案:B
17.Python中Object=(1, 2, 3, 4, 5),则Objcet是()
A.列表
B.元组
C.字典
D.集合
正确答案:B
18.打码平台一般通过()识别验证码。
A.人工识别
B.机器学习识别
C.光学字符识别
D.深度学习识别
正确答案:A
19.以下哪个HTML标签表示定义文档或节的页脚()
A.
B.
C.
D.
正确答案:D
20.Chrome的开发者工具中哪个选项可以查找到cookies
A.Elements
B.Sources
work
D.Peformance
正确答案:C
二、 多选题 (共 10 道试题,共 20 分)
1.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司
A.服务器日志
B.数据库日志记录
C.程序日志记录
D.服务器监控
正确答案:ABCD
2.常用的会话跟踪技术是
A.session
B.cookies
C.moonpies
D.localstorage
正确答案:AB
3.下列关于在IOS上配置charles的说法正确的是()
A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B.手机和电脑需要在同一个局域网下。
C.HTTP代理可以使用“自动”选项。
D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数
您可能关注的文档
- 少儿英语教案设计案例分享kids-English-learning-teaching-design.doc
- 房屋建筑工程施工总结(葵蓬花地河一二期、穗盐路和花地变电站征地项目复建房).doc
- 一次函数的图象和性质(提高)巩固练习题.doc
- 北师大版七年级上数学第三章整式及加减 3.2 代数式 (22课件).pptx
- 小学信息技术基础知识复习总结题.doc
- 2020年高考政 治第一轮复习课件 生活和哲学 考点透析 第十二课 实现人生的价值.ppt
- 沪科版八年级2.3 第三节 第1课时 速度 练习试题.docx
- 道路交通疏解设计方案.docx
- 两天一夜幼儿园游学活动实施方案.doc
- 陈新班主任工作实践计划.docx
文档评论(0)