- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * (3)定距变量:标准差 标准差(S),也称为均方差,其定义为各变量值对其均值的离差平方的算术平均数的平方根。 公式: 5、相关和回归分析 (1)统计相关的性质 相关关系,则是指用一个统计值(即特定的相关系数)去表示两个变量相关关系。 注意:相关强度和相关方向 因果关系,是在有相关关系的两个变量中,如果明确说明了一个变量的变化引起了另一个变量的变化,那么这种关系就可以称为因果关系。 (2)消减误差比例 消减误差比例(简写为PRE)原理是:如果两变量间存在着一定的关联性,那么我们就可以通过一个变量去预测另一个变量,此时就会消减掉一定程度的由于盲目直接预测所带来的误差。 公式: (3)相关分析 第一,定类变量—定类(定序)变量: λ,λy,tau-y 公式: 例1 100名大学生的就业去向表1(λy) 就业去向 性别 男 女 总计 东部 25 20 45 中部 15 25 40 西部 15 0 15 总计 55 45 100 例2 100名大学生的就业去向表2(tau-y) 就业去向 性别 男 女 总计 东部 25 20 45 中部 15 10 25 西部 15 15 30 总计 55 45 100 第二,定序变量—定序变量 使用:G,dy 公式: 例 100名调查对象与其父亲的受教育水平( G ) 本人的受教育水平 总计 高 中 低 父亲的 受教育 水平 高 25 15 5 45 中 10 20 5 35 低 5 10 5 20 总计 40 45 15 100 第三,定距变量—定距变量 使用: r 公式: 第四,定类(定序)变量—定距变量 使用: E 公式: (4)一元线性回归 回归分析的目的就是要进一步考察两个变量间的因果关系,并找出一种用自变量去预测因变量数值的最小误差方法,其中最常用也是最简易的就是一元线性回归,即是根据一个直线方程式,以自变量的数值来预测因变量的数值: 公式: ,其中: 6、参数估计 参数估计是推论统计的第一种基本形式,指的是利用样本统计值对总体参数值进行推断或估计的统计过程和方法。 可分为:点值估计(略)、区间估计两种 (1)区间估计的基本概念 就是指在一定的置信水平下,根据样本统计值估算出总体参数值可能落在的具有上下限数值的某个区间。 置信水平:即总体的参数值落在置信区间的把握,或者说用置信区间去估计总体参数值时,成功的可能性有多大。 显著性水平а :表示用置信区间来估计总体参数不可靠的概率。 置信区间:在相应置信水平下,根据样本统计值估计总体参数值落在一定区间范围内,这个区间就是置信区间。 标准值Z :就是将每个变量值转换为在标准正态分布上的值。 (2)总体均值(μ)的区间估计 公式: ( n<30 ) 例:对某大学100名学生的抽样调查发现,调查对象每月通信费平均为45元,标准差为50元,在95%的置信水平下求该校大学生每月通信费的双侧置信区间。 解: (3)总体成数的区间估计 公式: 例:某企业根据100名职工的抽样调查发现,其中60人参加过各种形式的业余学习,求在99%的置信水平下,该企业职工参加业余学习比例的双侧置信区间。 解: 7、假设检验 (一)含义 所谓假设检验,就是在进行具体研究时,先成立一个总体情况的假设,然后抽取一个随机样本,最后以样本统计值来验证假设的统计过程和方法。 虚无假设与研究假设 拒绝域、接受域与临界值 一端检验与两端检验 (2)假设检验的原理 假设检验的基本思路是:小概率事件在一次一次抽样中是不可能出现的,那么既然在抽样中出现了小概率事件,我们该如何处理?可以坚持小概率事件确实在一次具体观察中发生了,但这样做就等同于违反了小概率原理,那么符合逻辑的处理方式就是认为在这次抽样中发生的“小”概率事件的概率其实不“小”,就不是真正的小概率事件。 (3)假设检验的步骤 写出假设,包括虚无假设和研究假设。 根据样本情况,计算在原假设成立的情况下,样本统计值所对应的Z值 结合给出的显著度的大小,比较Z值与给定显著度时临界Z值的大小,从而分析其到底落在拒绝域还是接受域。 得出最终结论。 (4)总体均值和成数的检验 公式:
文档评论(0)