网站大量收购闲置独家精品文档,联系QQ:2885784924

基于Python的电影票房信息数据的爬取及分析.doc

基于Python的电影票房信息数据的爬取及分析.doc

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE

PAGE1

广东东软学院本科毕业设计(论文)

摘要

现如今,人民群众对物质生活水平的要求已不再局限于衣食住行,对于精神文化有了更多的需求。电影在我国越来越受欢迎,电影业的发展越来越迅猛,为了充分利用互联网技术的发展,掌握电影业的态势,对信息进行挖掘和处理、提高数据库的利用率,本文采用文献分析法,对网络爬虫的相关内容以及发展现状进行简单介绍,并利用网页抓取技术爬取电影票房网站的相关数据,进行分析,为票房分析提供数据支撑。

关键词:Python网络爬虫电影票房

Abstract

Nowadays,thepeoplesrequirementsformateriallivingstandardsarenolongerlimitedtoclothing,food,housingandtransportation,andthereismoredemandforspiritualculture.MoviesarebecomingmoreandmoreFashionableinChina,andthemovieindustryisgrowingrapidly.InordertomakefulluseofthedevelopmentofInternettechnology,graspthesituationofthemovieindustry,mineandprocessinformation,andimprovetheutilizationrateofthedatabase,Thispaperintroducesthecontentanddevelopmentofwebcrawlerbyliteratureanalysis,andusewebpagecrawlingtechnologytocrawlandanalyzetheboxofficedatarelatedtomoviewebsites,whichprovidespowerfuldatasupportforboxofficeanalysis.

Keywords:Pythonwebcrawlermovieboxoffice

目录

TOC\o1-2\h\u28089摘要 1

25982Abstract 1

16422一、绪论 3

310311.1研究背景 4

103971.2研究现状 4

112781.3研究方法 4

18560二、系统开发工具与相关技术 5

112082.1Python网络爬虫 5

182122.2系统开发工具 5

2.2.1pycharm工具 5

2.2.2MySQL数据库 5

2.2.3HbuilderX工具 6

299882.3系统后台技术 6

134202.4系统前端技术 6

14217三、系统分析 8

312473.1系统功能分析 8

263173.2系统功能性需求分析 10

3.2.1系统用户功能性需求分析 10

3.2.2系统管理员功能性需求分析 12

263173.3数据获取 14

263173.4数据分析 13

263173.5数据展示 13

19986四、系统设计 15

287874.1文件结构图 15

287874.1.1前端demo文件结构图 15

287874.1.2后端爬虫系统文件结构图 15

78594.2前端功能模块 16

4.3登录与注册模块设计7859 16

4.4数据库表设计7859 17

4.5数据展示模块设计7859 18

五、系统实现7859 20

5.1解决网站反爬机制7859 20

5.2实现网络爬虫7859 23

5.2.1找出url变化规则并获取链接7859 26

5.2.2解析并获取网页数据7859 26

5.2.3将数据存储至数据库7859 27

5.3登录注册模块实现7859 28

5.4数据展示模块实现7859 28

14842六、票房网站信息数据爬取结果及分析 32

6.1以2019年的票房榜单Top20为例分析7859 32

6.2结果分析7859 32

1131七、结论与建议 36

7.1结果分析7859 36

7.2不足点7859 36

7.3对未来的展望7859 37

26500参考文献 38

15322致谢 3

文档评论(0)

181****2496 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档