项目4
爬虫与数据存储——
抓取网页并存储
;;;;;;将该文件保存为movies.html,并在浏览器中运行,网页效果如图4-2所示。;将该网页放到本地目录下,与Python脚本置于同一目录中。使用Requests和BeautifulSoup解析HTML内容,并提取表格数据。
代码如下。
?
importrequests
frombs4importBeautifulSoup
importcsv
#读取本地HTML文件或请求远程网页
url=movies.html
withopen(url,r,encoding=utf-8-sig)asf:
html_c
原创力文档

文档评论(0)