Python爬虫试题及答案.docxVIP

下载本文档

1
0
约7.79千字
约 19页
2026-06-02 发布于上海
举报

Python爬虫试题及答案.docx

Python爬虫试题及答案

一、单项选择题（共10题，每题1分，共10分）

在Python中，常用于发送HTTPGET请求获取网页内容的第三方库是下列哪一项？

A.urllib

B.requests

C.BeautifulSoup

D.selenium

答案：B

解析：requests是Python中专门用于处理HTTP请求的常用第三方库，GET请求是其最基础且常用的功能，用于获取网页内容。urllib是Python内置的HTTP处理库，语法较为繁琐；BeautifulSoup是用于解析HTML/XML的库，不负责发送请求；selenium是用于自动化测试的库，常用于模拟浏览器操作，并非专门用于发送普通HTTPGET请求。

BeautifulSoup库解析HTML时，默认解析器是下列哪一项？

A.lxml

B.html.parser

C.html5lib

D.regex

答案：B

解析：BeautifulSoup的html.parser是Python内置的解析器，无需额外安装，兼容性强但解析速度稍慢；lxml是第三方解析器，解析速度更快但需单独安装；html5lib可解析不规范的HTML但体积较大；regex是正则表达式库，并非HTML解析器。

下列哪种方法可以修改requests请求的User-Agent请求头，避免被网站反爬识别？

Python爬虫试题及答案.docxVIP

Python爬虫试题及答案.docx

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档