Python网络爬虫技术项目化教程 课件 项目二 网页数据爬取——爬取图片、视频与半结构化数据.pptx

Python网络爬虫技术项目化教程 课件 项目二 网页数据爬取——爬取图片、视频与半结构化数据.pptx

项目2爬虫入门——网页数据抓取—抓取图片、视频与半结构化数据

任务2.1认识网络常见数据类型

2.1.1HTMLHTML是构建网页的基础语言,通过各类标签定义网页中的标题、段落、图片、链接等内容。示例如下:?!DOCTYPEhtmlhtmlheadmetacharset=UTF-8title我的第一个网页/title/headbodyh1欢迎来到我的网站/h1p这是一个简单的HTML示例。/p/body/html。

2.1.2XMLXML(可扩展标记语言)于1998年确立规范与标准并沿用至今,是当前因特网上保存和传输信息的主要

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档