统计分析方法的选择1013.pptVIP

下载本文档

3
0
约8.47千字
约 72页
2016-12-07 发布于重庆
举报
版权申诉

统计分析方法的选择1013.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计分析方法的选择1013

定量资料统计方法的合理选择 * * 定性资料统计分析方法选择 * 4 相关分析与回归分析的区别需要特别指出的是，回归分析中的R2在数学上恰好是Pearson积矩相关系数r的平方。因此，这极易使作者们错误地理解R2的含义，认为R2就是 “相关系数”或“相关系数的平方”。问题在于，对于自变量是普通变量（即其取值有确定性的变量）、因变量为随机变量的模型Ⅰ回归分析，2个变量之间的“相关性”概念根本不存在，又何谈“相关系数”呢？更值得注意的是，一些早期的教科书作者不是用R2来描述回归效果（拟合程度，拟合度）的，而是用Pearson积矩相关系数来描述。这就更容易误导读者。 5 重要的数理统计学常识 5.1 假设检验基本思想统计推断：是根据样本数据推断总体特征的一种方法。假设检验：是进行统计推断的途径之一（另一种途径是参数估计，如点估计和区间估计）。假设检验中的关键问题：1）在原假设成立的情况下，如何计算样本值或某一极端值发生的概率？2）如何界定小概率事件？ 5.1 假设检验基本思路首先，对总体参数值提出假设（原假设）；然后，利用样本数据提供的信息来验证所提出的假设是否成立（统计推断）——如果样本数据提供的信息不能证明上述假设成立，则应拒绝该假设；如果样本数据提供的信息不能证明上述假设不成立，则不应拒绝该假设。接受或拒绝原假设的依据小概率事件不可能发生。显然，这样做是有风险的（小概率事件真的发生了）。 5.1 假设检验基本步骤 1）提出原假设（或称“零假设”，H0）； 2）选择检验统计量； 3）根据样本数据计算检验统计量观测值的发生概率（相伴概率，p）； 4）根据给定的小概率事件界定标准（显著性水平，如0.05，0.01）做出统计推断。 5.1 假设检验基本步骤：为什么要设计并计算检验统计量？在假设检验中，样本值（或更极端的取值）发生的概率不能直接通过样本数据计算，而是通过计算检验统计量观测值的发生概率而间接得到的。所设计的检验统计量一般服从或近似服从某种已知的理论分布（如t-分布、F-分布、卡方分布），易于估算其取值概率。对于不同的假设检验和不同的总体，会有不同的选择检验统计量的理论和方法。 5.1 假设检验基本步骤：计算检验统计量观测值的发生概率在假定原假设成立的前提下，利用样本数据计算检验统计量观测值发生的概率（即p值，又称“相伴概率”—指该检验统计量在某个特定的极端区域在原假设成立时的概率）。该概率值间接地给出了在原假设成立的条件下样本值（或更极端值）发生的概率。 5.1 假设检验进行统计推断依据预先确定的 “显著性水平” （即α值），如0.01或0.05，决定是否拒绝原假设。如果p值小于α值，即认为原假设成立时检验统计量观测值的发生是小概率事件，则拒绝原假设。否则，就接受原假设。 5.2 显著性水平：概念与意义在假设检验中，显著性水平（Significant level，用α表示）的确定是假设检验中至关重要的问题。显著性水平是在原假设成立时检验统计量的制落在某个极端区域的概率值。因此，如果取α= 0.05，如果计算出的p值小于α ，则可认为原假设是一个不可能发生的小概率事件。当然，如果真的发生了，则犯错误的可能性为5%。显然，显著性水平反映了拒绝某一原假设时所犯错误的可能性，或者说， α是指拒绝了事实上正确的原假设的概率。 5.2 显著性水平：通常的取值 α值一般在进行假设检验前由研究者根据实际的需要确定。常用的取值是0.05或0.01。对于前者，相当于在原假设事实上正确的情况下，研究者接受这一假设的可能性为95%；对于后者，则研究者接受事实上正确的原假设的可能性为99%。显然，降低α值可以减少拒绝原假设的可能性。因此，在报告统计分析结果时，必须给出α值。 5.2 显著性水平：进行统计推断在进行假设检验时，各种统计软件均会给出检验统计量观测值以及原假设成立时该检验统计量取值的相伴概率（即检验统计量某特定取值及更极端可能值出现的概率，用p表示）。 p值是否小于事先确定的α值，是接受或拒绝原假设的依据。如果p值小于事先已确定的α值，就意味着检验统计量取值的可能性很小，进而可推断原假设成立的可能性很小，因而可以拒绝原假设。相反，如果p值大于事先已确定的α值，就不能拒绝原假设。 5.3 统计推断：过去的回忆 1）在计算机技术十分发达，以及专业统计软件功能十分强大的今天，计算检验统计量及其相伴概率是一件十分容易的事情。 2）然而，在20世纪90年代以前，只有服从标准正态分布的检验统计量，人们可以直接查阅事先准备好的标准正态分布函数表，从中获得特定计算结果的相伴概率。而对于的服从t-分布、F-分布、卡方分布或其它特殊的理论分布的检验统计量（大多数的假设检验是这样），人们无