06 re网页解析相关知识.docxVIP

  • 0
  • 0
  • 约2.33千字
  • 约 13页
  • 2026-05-29 发布于四川
  • 举报

PAGE

PAGE1

一、教学分析

课题名称

re网页解析

课程

大数据采集与分析

系部

任课教师

教材

《大数据采集与分析案例教程》

课题类型

理论+实践课

课时

2课时

地点

实训机房

班级

内容提要与时间分配:

1、学习目标

了解网页解析概念

了解re模块概念

掌握match方法、search方法、findall和finditer方法

掌握sub和subn方法、split方法、compile方法

理解并应用贪婪模式

灵活运用网页解析相关技术

2、教学内容

知识讲解:

网页解析概念和技术

(2)re模块概念

(3)match方法、search方法、findall和finditer方法

(4)sub和subn方法、split方法、compile方法

项目实施:

(1)学生使用正则表达式,匹配和提取段落中所有的英文名字。

(2)学生使用XPath,获取HTML中所有超链接的文本。

(3)学生使用BeautifulSoup,,获取第一个超链接的文本和所有超链接。

(4)使用math方法进行字符串匹配。

(5)使用search方法,查找段落中的数字和Python关键字。

内容总结:总结本节课程中遇到的问题,并对涉及到的知识点进行梳理。

3、本次课程内容特点:

本节课程由理论和实践组成,介绍了网页解析概念和正则表达式、xpath等相关技术,在小示例的引导下,在理解

文档评论(0)

1亿VIP精品文档

相关文档