Python数据工程师实战案例教程第1章课后习题答案.docxVIP

下载本文档

0
0
约1.16千字
约 2页
2026-01-21 发布于湖南
举报

Python数据工程师实战案例教程第1章课后习题答案.docx

第1章课后习题答案

选择题

填空题

urllib库提供的发送HTTP请求的主要函数是urlopen。

requests库可以通过get函数发送GET请求。

判断题

True

False

简答题

urllib库和requests库的安装方法如下：

urllib库：urllib库是Python的标准库，无需额外安装即可使用。

requests库：可以通过使用pip命令来安装requests库。在命令行中执行pipinstallrequests即可安装requests库。

使用requests库发送POST请求的基本步骤如下：

导入requests库：在Python代码中引入requests库，可以使用importrequests语句导入。

构造请求参数：创建一个字典对象，用于存储POST请求的参数。

发送POST请求：调用requests库的post函数，传入目标网址和请求参数，发送POST请求。例如，response=requests.post(url,data=params)。

处理响应结果：根据返回的响应结果，可以通过response对象的方法和属性来获取相关信息，如获取返回的状态码、响应头、响应内容等。

五、操作题

使用Python中的requests库和BeautifulSoup库爬取网站上的一篇文章，并提取出文章的标题和正文内容。请按照以下步骤完成：

1.使用requests库发送请求获取网页内容。

2.使用BeautifulSoup解析网页内容，提取文章标题和正文部分。

输出提取到的文章标题和正文内容。

注意：?请确保已安装requests和BeautifulSoup库。

importrequests

frombs4importBeautifulSoup

#发送请求获取网页内容

url=这里填写你要爬取的网页URL

response=requests.get(url)

html_content=response.text

#使用BeautifulSoup解析网页内容

soup=BeautifulSoup(html_content,html.parser)

#提取文章标题和正文内容

article_title=soup.find(h1).text#假设标题是h1标签

article_body=soup.find(div,class_=content).text#假设正文内容在class为content的div标签中

#输出提取到的文章标题和正文内容

print(文章标题：,article_title)

print(正文内容：,article_body)

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

Python数据工程师实战案例教程第1章课后习题答案.docxVIP