- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
下列不属于常见爬虫类型的是()。
A:增量式网络爬虫
B:浅层网络爬虫
C:通用网络爬虫
D:聚焦网络爬虫
答案
2.下列不属于聚焦网络爬虫的常用策略的是()。
A:基于内容评价的爬取策略
B:基于深度优先的爬取策略
C:基于语境图的爬取策略
D:基于链接结构评价的爬取策略
答案:B
3.下列不属于常用反爬手段的是()。
A:反爬频度
B:验证码校验
C:账号权限
D:人工筛选
答案:D
4.下列属于反爬虫目的的是()。
A:防止网站信息被竞争对手随意获取
B:限制用户访问权限
C:限制访问人数
D:变换网页结构
答案:A
5.下列属关于Python爬虫库的功能描述不正确的是()。
A:HTML/XML解析器pycurl`
B:通用爬虫库urllib3
C:通用爬虫库Requests
D:爬虫框架Scrapy
答案:A
6.搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存
在本地。()
A:对
B:错
答案:A
7.robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着
的是可以爬虫的网页。()
A:错
答案
8.爬虫是手动请求万维网网站且提取网页数据的程序。()
A:错
B:对
答案:A
9.每个网站都有robots.txt文件。()
A:对
B:错
答案:B
10.爬虫爬取的是网站后台的数据。()
A:对
B:错
答案:B
项目二测试
1.吉多设计Python的灵感来源于()。
A:C语言
B:ABC语言
C:Unixshell
D:Java语言
答案:B
2.下列关于Python语言的特点说法中,错误的是()。
A:ANSIC
B:Go
C:Python语言是非开源语言
D:Python语言是跨平台语言
答案:C
3.Python源代码文件的后缀名是()
A:png
B:doc
C:pdf
D:py
答案:D
4.列表list=[1,2,3,4,5],下列选项中为空的是()
A:ist[1:1]
B:list[1:-1]
C:list[1:]
D:list[:-2]
答案:A
5.Python语言中用来定义函数的关键字是()
A:class
C:return
D:function
6.在安装Python时,需要根据已有的系统来选择相应的安装程序。安装后,
也需要配置环境变量。()
A:错
B:对
答案:B
7.elif语句可以单独使用。()
A:对
B:错
答案:B
8.元组的元素不能修改。()
A:错
B:对
答案:B
9.下列选项中,不能创建元组的语句是()。
A:tup=(2)
B:tup=(1,2,98)
C:tup=tuple([1,2,3])
D:tup=[1,2,3]
答案:AD
项目三测试
1.如果站点服务器支持安全套接层(SSL),那么连接到安全站点上的所有URL
开头是()。
文档评论(0)