- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《Python网络爬虫技术案例教程》
课程标准
【课程名称】Python网络爬虫【课程编码】
【课程类别】专业必修课
【适用专业】计算机、大数据、人工智能等相关专业
【授课单位】【总学时】56
【编写执笔人】【编写日期】
一、课程性质和课程设计
1.1课程制定依据
随着大数据和人工智能技术的快速发展,网络爬虫技术在数据获取、信息检索、市场分
析等领域扮演着越来越重要的角色。因此,该课程的制定首先需要考虑行业对爬虫技术人才
的需求,以及如何通过课程培养具备爬虫技术能力的专业人才。
在制定课程时,需要参考计算机科学和相关学科的知识体系,确保课程内容涵盖网络爬
虫的基本原理、技术方法、实践应用等方面。同时,还需要遵循教学大纲的要求,合理安排
课程的学时、学分、教学内容和教学方法等。
1.2课程性质与作用
本课程是计算机、大数据、人工智能等相关专业的专业必修课,课程全面地介绍了Python
网络爬虫在不同场景下采用不同技术爬取网络数据的方法,内容包括网络爬虫入门、爬虫基
础、网页解析基础、爬取动态加载数据、反爬虫策略、模拟登录和处理验证码、爬取App
和PC客户端数据、爬虫框架Scrapy、分布式爬虫等。课程强调实践操作,让学生在完成具
体项目的过程中学会使用Python进行网络爬虫开发,并构建相关理论知识,提升解决实际
问题的能力。
本课程的前续课程为:“Python程序设计基础”“HTML5基础”“数据库技术”;与本课程
可以平行开展的课程为web后台技术类课程如:“PHP开发基础”“Web应用开发技术”等
相关课程;本课程的后续课程为“Python数据分析技术”。
1.3课程设计思路
本课程首先以计算机、大数据、人工智能等专业相关的岗位职业能力分析为基础,课程
设计面向整个直接对应的工作岗位,并围绕工作过程,将从业所需要的知识、技能、态度有
机地整合在一起,以切实培养学生的职业岗位技能。因此,课程的设计以典型工作任务为逻
辑起点,特别强调在培养职业专门技能的同时,兼顾到学生将来可持续发展能力的培养,形
成了“岗位+职业发展”的基于工作过程的课程设计理念。
二、课程目标
2.1知识目标
(1)理解网络爬虫的原理、分类和应用。
(2)掌握网络爬虫的工作流程。
(3)了解网络爬虫协议。
(4)理解HTTP的基本原理。
(5)了解urllib库的使用方法。
(6)掌握requests库的使用方法。
(7)了解Python中的字符编码。
(8)理解网页基础知识。
(9)掌握lxml库的使用方法。
(10)掌握beautifulsoup4库的使用方法。
(11)了解正则表达式的使用方法。
(12)掌握存储数据至JSON或CSV文件的方法。
(13)理解什么是动态加载数据。
(14)掌握使用逆向分析请求页面爬取动态加载数据的方法。
(15)掌握使用Selenium模拟浏览器爬取动态加载数据的方法。
(16)掌握将数据存储至MySQL数据库和MongoDB数据库的方法。
(17)理解反爬虫的原因。
(18)了解反爬虫策略。
(19)掌握应对反爬虫的措施。
(20)理解Session会话机制。
(21)掌握使用Session模拟登录并保持登录状态的方法。
(22)掌握处理图片验证码、点触验证码和滑动拼图验证码的方法。
(23)掌握使用Fiddler爬取Android手机App数据的方法。
(24)掌握使用Fiddler和Proxifier爬取PC客户端数据的方法。
(25)理解Scrapy框架的构成。
(26)掌握使用Scrapy框架创建爬虫程序获取所需数据的方法。
(27)理解分布式爬虫原理。
(2
您可能关注的文档
- 《[国规]大学美育基础》课程标准.pdf
- 《Excel数据处理与分析案例教程[Win 10+Excel 2016]》课程标准.pdf
- 《Hadoop大数据处理实战》课程标准.pdf
- 《SPSS统计分析案例教程》课程标准.pdf
- 《财经法规与会计职业道德》课程标准.pdf
- 《财经应用文写作》课程标准.pdf
- 《茶文化与茶艺》课程标准.pdf
- 《车削加工实训指导》课程标准.pdf
- 《电子技术基础与应用》课程标准 .pdf
- 《电子商务安全》课程标准.pdf
- 中考语文复习专题二整本书阅读课件.ppt
- 中考语文复习积累与运用课件.ppt
- 2025年初中学业水平考试模拟试题(二)课件.ppt
- 四川省2015届理科综合试题48套第12套.pdf
- 【课件】战争与和平—美术作品反映战争+课件-2024-2025学年高中美术湘美版(2019)美术鉴赏.pptx
- 【课件】青春牢筑国家安全防线 课件 2024-2025学年高中树立总体国家安全观主题班会.pptx
- 【课件】原始人的创造+课件高中美术湘美版(2019)美术鉴赏.pptx
- 上海证券-美容护理行业周报:流量加快去中心化,强运营头部品牌影响较小 -2024-.pdf
- T_CSEIA 1005—2023_能源工业互联网平台数据治理要求.pdf
- T_CDSA 504.16-2023_急流救援技术培训与考核要求.pdf
最近下载
- GJB 841 FRACAS 故障报告、分析和纠正措施系统.docx
- 1.4高压断路器的检修.ppt VIP
- 2023-2024学年湖北省武汉市华中师范大学第一附属中学高三(上)期中检测物理试卷+答案解析(附后).pdf VIP
- 箱变安装分项及检验批验收报审和评定表.doc
- 生态规划复习试题.doc
- 2024年中考外研版英语一轮复习课件八年级下册 Modules4~6.pptx VIP
- 山东省济南2024年七年级下学期数学期中试卷2套(附答案).docx VIP
- 医院涉及未成年人被侵害案件的强制报告机制.docx VIP
- 2023年平顶山职业技术学院单招职业适应性测试题库及答案解析word版.pdf VIP
- 山东省济南2024年七年级下学期数学期中考试试卷(附答案) .docx VIP
文档评论(0)