- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模讲座 第一部分 理论分析 一、SPSS简介 二、回归分析 SPSS简介 随着人们生活水平的提高和市场经济的发展,计算机普及程度越来越高,人们越来越倾向于用计算机处理大量的数据。另一方面,社会向着多元化和复杂化方向发展,很多问题需要通过实证调查资料来证实;民生进程加快,大量民生、民情问题调查资料及大量民意的处理,都离不开计算机数据处理。目前市场上数据处理软件很多,各有特色。有以资料查询为目的的数据库软件Access,有以数学分析为目的的软件Mathmatica,有进行少量数据资料分析和处理的通用软件Excel,也有进行大量数据、调查资料统计与分析的专业处理软件SPSS。 SPSS的诞生 20世纪60年代后期,美国斯坦福大学Norman H.Nie等3位研究生研制了最初的SPSS统计分析系统。Norman H. Nie等人于1975年在芝加哥组建了SPSS有限公司。随着微机的问世,该公司率先推出了微机版的SPSS,占领了微机市场。1984年,SPSS公司推出第一个微机版软件SPSS/PC+2.0版本,而后又推出适用于UNIX、Macintosh和OS/2等操作系统的SPSS软件产品。1992年,SPSS成为世界上提供窗口(Windows)5.0版统计软件的最主要供应商。而后该公司不断推出了新的窗口系统,几乎每一两年就提高一个版本,现在最新版本是18.0,但很多单位和个人使用的仍是SPSS12.0~16.0。 2. SPSS的应用及功能 SPSS原是指“Statistics Package for Social Science”,即社会科学统计软件包,但其实际应用范围已远远超出社会科学范畴,在自然科学、生物和医学等领域得到了广泛应用。20世纪90年代,SPSS已变成“Statistical ProductsService Solutions”,即统计产品与服务解决方案,在Windows环境下执行,适用于WindowsXP和Vista。SPSS软件是世界上问世最早、应用最广、最易操作的统计软件,同时也是我国最流行的社会调查资料分析软件。SPSS适用于市场营销、销售分析、市场调查、统计报告、质量控制、科学研究、社会调查、企业管理及行政管理等领域,具有数据管理、统计分析、数据和图形展示及打印等功能 3. SPSS主要菜单介绍 (1)File菜单 (2)Edit菜单 (3)Data菜单 (4)Transform菜单 (5)Analyze菜单 (6)Graphs菜单 回归分析前言 1.1 线性回归分析 1.2 曲线回归估计 1.3 最优量表回归分析 1.4 二值Logistic回归分析 1.5 多值Logistic回归分析 1.1 线性回归分析 线性回归分析一般分成一元线性回归分析和多 元线性回归分析。SPSS软件对线性回归采用Linear 子模型。 1.1.1 一元线性回归模型 1.设 x 为自变量,y为因变量,它们满足: 其中, 、 是未知常数,称为回归系数, 为 残差项或随机干扰项。要求 满足: ①每个都是一个随机变量,且互相独立,与x无关; ② 的均值为零,即 ; ③在每一个时期中,的方差为常量,即 ; 2. 一元线性回归模型的检验 从直观上,回归直线较好地刻画了离散数据的变化趋势,但这种直观的观察的说服力并不强,需要从统计分析的角度对建立的模型进行统计检验,主要分为: 拟合优度检验 对于一个回归方程而言,即使它通过了显著性检 验,还不能说结果就很好,还需要从回归好坏程度, 即拟合优度的角度检验回归方程。 对于线性回归模型,主要通过复相关系数R2和调整 的复相关系数(adjust R2)来度量拟合优度。 显然,0R21,且R2越接近1,因变量y与自变量x之间 的线性相关程度越强,拟合优度越好。 1.1.2 多元线性回归模型 多元线性回归方程 多元线性回归模型是处理多个变量之间关 系的最简单模型,其一般表达式为 其中, , 是未知参数 方程 称为多元线性 回归方程 2. 多元线性回归模型的检验 与一元线性回归模型的检验一样,多元 线性回归模型的检验也主要分为: 3. 强影响点的识别 (1) 定义 强影响点是指对多元线性回归模型影响较大的数据点,或者偏离回归预测值较远的数据点。 (2) 识别参数 强影响点的识别参数(Casewise diagnostics) 是由线性回归方程的Statistics提供。它是利用 计算出来的样本点的标准差为依据,识别出偏离 均值较大的样本点。 4. 多重共线性变量
文档评论(0)