项目七 国内旅游人数与旅游收入回归分析.pptxVIP

项目七 国内旅游人数与旅游收入回归分析.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Python数据分析与挖掘

教材出版者:中国石油大学出版社主编:宁玉富汪早荣王娟陈晓华书号:ISBN978-7-5636-8248-5

目录01.入门篇02.准备篇03.技法篇04.算法篇05.实战篇项目一初识数据分析项目二开发环境的搭建项目三旅游景点数据分析项目四旅游景点数据可视化项目五旅客聚类分析项目六旅客流失预测分析项目七国内旅游人数与旅游收入回归分析项目八游客画像分析实训实例

项目七国内旅游人数与旅游收入回归分析算法篇

学习目标了解线性回归的基本概念。掌握Sklearn库的LinearRegression方法的使用。建立基于线性回归的国内旅游人数与国内旅游收入之间的相关性模型,并根据国内旅游人数进行国内旅游收入预测。掌握线性回归模型评估方法。国内旅游人数与旅游收入回归分析学习目标

02使用LinearRegression方法建立基于线性回归的国内旅游人数与国内旅游收入之间的相关性模型,并能够进行模型评估选择合适的模型进行国内旅游人数进行国内旅游收入预测。重点难点重点难点01

项目描述自然是生命之母,人与自然是生命共同体。无论是黄河长江“母亲河”,还是碧波荡漾的青海湖,逶迤磅礴的雅鲁藏布江;无论是南水北调的世纪工程,还是塞罕坝林场的“绿色地图”;无论是云南大象北上南归,还是藏羚羊繁衍迁徙……这些都昭示着,人不负青山,青山定不负人。经过多年的环境保护,我国自然环境污染问题已经得到极大改善,据近几年的《中国国内旅游发展年度报告》显示,人们旅游更倾向于亲近大自然,滨水休闲、生态康养、乡村田园、都市休闲、避暑旅居等旅游产品都受到游客喜爱。表1所示为2001-2019年我国国内的旅游情况统计,包括国内旅游收入(亿元)、国内旅游人数(百万人次)。一般来说,国内旅游人数越多,国内旅游收入越多,于是可以推断出,国内旅游收入与国内旅游人数有一定的关系,找出这个关系并建立模型,通过国内旅游人数预测国内旅游收入。

项目描述年份国内旅游收入Y(亿元)国内旅游人数X2(百万人次478420023878.3687820033442.2787020043878.4110220053442.3121220064710.7139420075285.9161020088749.31712200910183.71902201012579.82103表7-12001-2019年我国国内旅游情况统计年份国内旅游收入Y(亿元)国内旅游人数X2(百万人次)201119305.42641201222706.22957201326276.13262201430311.93611201534195.14000201639389.824435201745660.775001201851278.295539201957250.926006

任务01任务一数据可视化02任务二模型构建

任务一数据可视化

任务说明读取数据,使用Python的Pandas工具读取数据为DataFrame,对数据进行预处理;通过Python的Matplotlib工具画出国内旅游人数与国内旅游收入之间的数据关系。

任务实现:(1)读取数据。用Python读取Excel表格数据,代码如下:图7-1Python读取excel表格数据

任务实现:为了便于数据的处理,我们将列名改为英文名,“年”改为“year”,“国内旅游收入Y”改为“income”,“国内旅游人数X2”改为“population”。修改之后的数据如图7-2所示:其中自变量x为data[“population”],因变量y为data[“income”],标签labels为data[“year”]图7-2修改列名之后的数据

任务实现:(2)使用Matplotlib进行画图,并进行分析

任务实现:画出的图如7-3所示:图7-3国内旅游人数与国内旅游收入关系图通过图表可以看出,国内旅游收入随国内旅游人数的增加呈现线性增长,所以我们可以用线性回归模型建模。

小结:本小节使用Python中的Matplotlib库将原始数据以图表形式展示,通过画图可以对数据做初步分析,对数据之间的关系做出初步假设,为之后的模型构建打下基础。

任务二模型构建

任务说明:1.构建模型,导入Python的Sklearn中的LinearRegression模块,构建线性回归模型;2.模型评估,使用Sklearn库的评估方法对模型进行评估。

知识引入:线性回归起源与发展线性回归起源于弗朗西斯·高尔顿,他对父代与子代身高的关系充满兴趣,搜集了1078对夫妇及其儿子的身高数据,经过仔细观察分析,他发现可以将父母身高和儿子身高的关系拟合成一条直线,

文档评论(0)

zs521 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档