Python数据工程师实战案例教程第1章课后习题答案.docxVIP

  • 0
  • 0
  • 约1.16千字
  • 约 2页
  • 2026-01-21 发布于湖南
  • 举报

Python数据工程师实战案例教程第1章课后习题答案.docx

第1章课后习题答案

选择题

A

B

填空题

urllib库提供的发送HTTP请求的主要函数是urlopen。

requests库可以通过get函数发送GET请求。

判断题

True

False

简答题

urllib库和requests库的安装方法如下:

urllib库:urllib库是Python的标准库,无需额外安装即可使用。

requests库:可以通过使用pip命令来安装requests库。在命令行中执行pipinstallrequests即可安装requests库。

使用requests库发送POST请求的基本步骤如下:

导入requests库:在Python代码中引入requests库,可以使用importrequests语句导入。

构造请求参数:创建一个字典对象,用于存储POST请求的参数。

发送POST请求:调用requests库的post函数,传入目标网址和请求参数,发送POST请求。例如,response=requests.post(url,data=params)。

处理响应结果:根据返回的响应结果,可以通过response对象的方法和属性来获取相关信息,如获取返回的状态码、响应头、响应内容等。

五、操作题

使用Python中的requests库和BeautifulSoup库爬取网站上的一篇文章,并提取出文章的标题和正文内容。请按照以下步骤完成:

1.使用requests库发送请求获取网页内容。

2.使用BeautifulSoup解析网页内容,提取文章标题和正文部分。

输出提取到的文章标题和正文内容。

注意:?请确保已安装requests和BeautifulSoup库。

importrequests

frombs4importBeautifulSoup

#发送请求获取网页内容

url=这里填写你要爬取的网页URL

response=requests.get(url)

html_content=response.text

#使用BeautifulSoup解析网页内容

soup=BeautifulSoup(html_content,html.parser)

#提取文章标题和正文内容

article_title=soup.find(h1).text#假设标题是h1标签

article_body=soup.find(div,class_=content).text#假设正文内容在class为content的div标签中

#输出提取到的文章标题和正文内容

print(文章标题:,article_title)

print(正文内容:,article_body)

文档评论(0)

1亿VIP精品文档

相关文档