多元统计分析思考题.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计分析思考题

《多元统计分析思考题》 回归分析 1、回归分析是怎样的一种统计方法,用来解决什么问题? 回归分析是基于观测数据建立变量之间的某种依赖关系,分析数据的内在规律,并可用于预报、控制等方面。 2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才能做线性回归吗?为什么? 线性关系指的是自变量与因变量之间的关系。不一定, 3、实际应用中,如何设定回归方程的形式? 4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么? 回归系数是在回归方程中表示自变量x 对因变量y 影响大小的参数。回归系数越大表示x 对y 影响越大,正回归系数表示y 随x 增大而增大,负回归系数表示y 随x增大而减小。 。 p值是P(),表示第一、第二自由度分别为p、(n-p-1)的F变量大于的概率(即接受H0、线性关系不显著的概率) 系数:SSE 10、回归分析中的R2有何意义?它能用来衡量模型优劣吗? 回归平方和与总离差平方和之比:作为评判一个模型拟合优度的标准,成为样本决定系数。模型拟合优度并不是评判模型质量的唯一标准,R方越大,代表y接受变化的能力越强,不确定性和模型复杂程度较小,并不足以表明模型的真是可靠性,不能说明模型接近真实情况的程度,还要考虑真实情况的不确定性和复杂程度,不确定性和复杂程度较大的时候,R方小范儿更有意义。有时为了追求模型的实际意义,可以在一定程度上房款对拟合优度的要求。 11、如何确定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不存在交互作用的情形下是否相同?为什么? 12、有哪些确定最优回归模型的准则?如何选择回归变量?(P55) 自变量选择准则: ①(拟合)修正的复相关系数达到最大,等价于:均方残差MSE达到最小; ②预测平方和达到最小(偏差平方和) ③准则 其中是包含p个自变量的回归方程的残差平方和,表示含有所有m个自变量的回归方程的均方残差。该准则要求选择最小,且小的回归方程。 ④(极大似然估计)ACI准则,赤池信息量达到最小 13、在怎样的情况下需要建立标准化的回归模型?标准化回归模型与非标准化模型有何关系?形式有否不同?(P42) 在多元线性回归分析中,所涉及到的诸多自变量往往量纲不同,甚至差别很大,这时就需要对变量进行中心化或标准化,数据的中心化处理相当于将坐标原点移至样本中心,而坐标系的平移不改变斜率,只改变了截距;标准化处理后建立的回归方程相比非标准化的回归方程少了一个常数项,系数之间的关系为: 14、利用回归方法解决实际问题的大致步骤是怎样的? 15、你能够利用哪些软件实现进行回归分析?能否解释全部的软件输出结果? 判别分析 1、判别分析的目的是什么? 在自然科学和社会科学的研究中,研究对象用某种方法已划分为若干类型,当得到的一个新的样品数据,要确定该样品属于已知类型中的哪一类,这就是判别分析的目的。 2、有哪些常用的判别分析方法?这些方法的基本原理或步骤是怎样的?它们各有什么特点或优劣之处? 判别方法 基本原理 特点 距离判别法 根据已知分类的数据,分别计算各类的重心,即分类的均值;判别准则是:对任意一个样品,若它与第i类的重心距离最近,就认为它来自第i类。 优:对各类(或总体)的分布并无特定的要求; Fisher判别法 基本思想是投影,将k组m元数据投影到某一个方向,使得投影后组与组之间尽可能分开,其中利用了一元方差分析的思想导出判别函数(可以是线性的也可以是非线性的) 优:该方法对总体的分布并未提出特定要求,是处理概率分布未知的一种方法; Bayes判别法 假设对所研究的对象(总体)在抽样前已有一定的认识,常用先验概率分布来描述这种认识,然后基于抽取的样本再对先验认识做修正,得到后验概率分布,再基于后验概率分布做各种统计推断。 该判别考虑了总体的先验概率分布和误判损失 逐步判别法 逐步引入一个“最重要”的变量进入判别式,同时对先引入判别式的一些变量进行检验,如果他们的判别能力随着引入新变量而变得不显著了,则将它从判别式中剔除,直至没有新变量能够进入,依然没有旧变量需要剔除为止。 3、判别分析与回归分析有何异同之处? 同: 异: 4、判别分析对变量与样本规模有何要求? 5、如何度量判别效果?有哪些影响判别效果的因素? 通过评价判别准则来度量判别效果,方法有(1)误判率回代估计法;(2)误判率的交叉确认估计;(P75) 影响因素: 6、逐步判别是如何选择判别变量的?基本思想或步骤是什么? 在判别分析中,并非观测变量越多越好,而应该选取主要变量进行判别分析,因为每一个变量在判别式中所起的作用一般来说不相同,有的起重要作用,有的起低微作用,,如果将判别能力低微的变

文档评论(0)

kakaxi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档