- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商业分析概论;常用统计分析方法;目录;7.1 描述性统计分析;回归分析是处理变量之间关系的一种统计方法和技术,其基本思想、方法以及“回归(Regression)”名称的由来都要归功于英国统计学家F·Galton(1822~1911)。
;回归分析主要解决以下几方面的问题:
⑴通过分析大量的样本数据,确定变量之间的数学关系式。
⑵对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。
⑶利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。
;一元线性回归分析
一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。;;回归模型的显著性检验问题
通过样本数据建立一个回归方程后,不能立即用于对某个实际问题的预测。因为,将应用最小二乘法求得的样本回归直线作为对总体回归直线的近似,这种近似是否合理必须通过各种统计检验。一般经常使用以下的统计检验。;回归系数的显著性检验(t检验)
所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验,也就是检验斜率。
回归系数显著性检验的基本步骤;一元线性回归
回归模型:y=β0+β1x+ε (x为自变量,y为因变量, β0为截距, β1为斜率(回归系数), ε为误差变量。)
指定 H0:β1=0;备择假设为H1: β1≠0
检验统计量为:
其中,Sb1是b1的标准偏差(标准误差),
;如果误差变量服从正态分布,那么检验统计量服从自由度为n-2的t分布。拒绝域为
当原假设为真,就说明两个变量间没有线性关系;当备选假设为真,则两个变量存在某种线性关系。
SPSS的实际操作中,我们只要关注t检验的显著性(Significance)值(sig值)。我们一般将这个sig值与0.05比较,当sig值小于0.05,我们认为差别显著;当sig值大于0.05,我们认为差别??显著;sig值越小,说明差别越显著,回归系数越显著。;拟合优度检验
回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的拟合程度。
回归方程的拟合优度检验一般用判定系数(Coefficient of Determination)实现,用R2表示。该指标建立在对总离差平方和进行分解的基础之上。测定多元线性回归的拟合程度,与一元线性回归中的判定系数类似,使用调整后的判定系数。;拟合优度检验;因此将差异分解为两个部分:SSE度量y中不可解释的差异部分;SSR度量y中可以被自变量x的差异解释的差异部分。把这个分析过程整合到R2的定义中去:
因此,R2衡量了y的差异中能够被x的差异解释的部分在总差异中所占的比例。一般来说,R2的值越大,模型拟合数据的效果就越好。;回归方程的显著性检验(F检验)
回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。回归方程的显著性检验一般采用F检验,利用方差分析的方法进行。
检验统计量为:
拒绝域为:;因变量的总差异可以分解为可解释的差异和不可解释的差异两个部分:
而F=MSR/MSE,因此,若F值较大,表明因变量的总差异中可被回归方程解释的部分所占的比例较大,回归模型有效
在SPSS软件的实际操作中,我们也主要观察它的sig值,只要sig小于0.05,我们就认为回归模型是显著的;多元线性回归分析
一元线性回归问题只涉及了一个自变量,但在实际问题中,影响因变量的因素往往有多个。
在线性相关条件下,研究两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。
多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上更为复杂,一般需借助计算机来完成。多元线性回归模型的确定时常用逐步回归方法(Stepwise)。
;;多元线性回归中还需要注意多元共线性问题。多重共线性指自变量间存在线性相关关系,即一个自变量可以用其他一个或几个自变量的线性表达式进行表示。
多元共线性会有两个不利影响:
1. 估计回归系数时会产生较大的抽样误差
2. 会影响系数的t检验,使依据t检验做出的是否线性相关的推断发生错误。;为了避免或者修正多元共线性,我们采用两种方法:
1. 在建立模型时要尽可能确保自变量之间的相互独立性
2. 另一个是逐步回归
只有当某个自变量能够改变模型的拟合效果时,才把它放在模型中。如果两个自变量强
文档评论(0)