Python爬虫试题及答案.docxVIP

  • 1
  • 0
  • 约7.79千字
  • 约 19页
  • 2026-06-02 发布于上海
  • 举报

Python爬虫试题及答案

一、单项选择题(共10题,每题1分,共10分)

在Python中,常用于发送HTTPGET请求获取网页内容的第三方库是下列哪一项?

A.urllib

B.requests

C.BeautifulSoup

D.selenium

答案:B

解析:requests是Python中专门用于处理HTTP请求的常用第三方库,GET请求是其最基础且常用的功能,用于获取网页内容。urllib是Python内置的HTTP处理库,语法较为繁琐;BeautifulSoup是用于解析HTML/XML的库,不负责发送请求;selenium是用于自动化测试的库,常用于模拟浏览器操作,并非专门用于发送普通HTTPGET请求。

BeautifulSoup库解析HTML时,默认解析器是下列哪一项?

A.lxml

B.html.parser

C.html5lib

D.regex

答案:B

解析:BeautifulSoup的html.parser是Python内置的解析器,无需额外安装,兼容性强但解析速度稍慢;lxml是第三方解析器,解析速度更快但需单独安装;html5lib可解析不规范的HTML但体积较大;regex是正则表达式库,并非HTML解析器。

下列哪种方法可以修改requests请求的User-Agent请求头,避免被网站反爬识别?

A.在requests.

文档评论(0)

1亿VIP精品文档

相关文档