- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SPSS19.0实战之多元线性回归分析
(2011-12-0912:19:11)
转载▼
标签:分类:软件介绍
文化
线性回归数据(全国各地区能源消耗量与产量)来源,可点击协会博客数据挖掘栏:国
泰安数据服务中心的经济研究数据库。
1.1数据预处理
数据预处理包括的内容非常广泛,包括数据清理和描述性数据汇总,数据集成和变换,数
据归约,数据离散化等。本次实习主要涉及的数据预处理只包括数据清理和描述性数据汇
总。一般意义的数据预处理包括缺失值填写和噪声数据的处理。于此我们只对数据做缺失
值填充,但是依然将其统称数据清理。
1.1.1数据导入与定义
单击“打开数据文档”,将xls格式的全国各地区能源消耗量与产量的数据导入SPSS中,如
图1-1所示。
图1-1导入数据
导入过程中,各个字段的值都被转化为字符串型(String),我们需要手动将相应的字段转
回数值型。单击菜单栏的“”--将所选“”的变量改为数值型。如图1-2所示:
图1-2定义变量数据类型
1.1.2数据清理
数据清理包括缺失值的填写和还需要使用SPSS分析工具来检查各个变量的数据完整性。单
击“”--“”,将检查所输入的数据的缺失值个数以及百分比等。如图1-3所示:
图1-3缺失值分析
能源数据缺失值分析结果如表1-1所示:
单变量统计
N均值标准差缺失极值数目a
计数百分比低高
能源消费总量309638.506175.9240.001
煤炭消费量309728.997472.2590.002
焦炭消费量30874.611053.0080.002
原油消费量281177.511282.74426.701
汽油消费量30230.05170.2700.001
煤油消费量2845.4066.18926.704
柴油消费量30392.34300.9790.002
燃料油消费量30141.00313.4670.003
天然气消费量3019.5622.0440.002
电力消费量30949.64711.6640.003
原煤产量269125.9712180.689413.302
焦炭产量291026.491727.73513.302
原油产量181026.481231.7241240.000
燃料油产量2590.72134.150516.703
汽油产量26215.18210.090413.302
煤油产量2048.4462.1301033.3
文档评论(0)