第2章:单变量描述分析(下).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章:单变量描述分析(下)

第二章 单变量描述分析(下);第四节 集中趋势测量法;选取集中值的方法取决于三个因素:;一、众数(Mode);Notice;众值的计算;2、利用频数/频率分布表求众数;3、利用分组材料(组距式分组)求众数;表3、100名男性青年的身高统计表 ;(2)比例插值法:;二、中位数(Median);Notice:;表4、家庭人口数量分布表;;中位数的计算 ;表5;表6;2)定距变量:;对于有偶数个案的定距变量而言,其中位数可能是个特征值而非变量值。 表7;练习:;2、利用频数分布求中位数 需要先做累计频数/频率表;定距变量也一样,方法即作累计频率表,找出 50%所对应的个案,它的取值就是中位数。 表9、美国进口的中国母猪产仔数量统计表;3、利用分组数据求中位数(只适用于定距变量):;表10、每周工作时间的分布;;三、均值(Mean);1、原始数据;【例】某研究生班10名同学的年龄如下: 21,32,23,41,20,30,36,22,25,27 求平均年龄。;2、根据频数分布求均值(加权平均数);【例】求以下550人的平均分数 表12;如果是频率分布,则是;3、分组数据;表14、每天看电视时间的统计;四、众数、中位数与均值的进一步讨论;(1)三个集中值的适用范围;(2)三个集中值实际含义上的差别;(3)什么情况下不宜采用均值?;(4)三者的数量关系如何?;第五节 离散趋势测量法;一、极差(Range)R;notice;二、四分位差(interquartile range)Q;Q25和Q75位置的确定;四分位差的计算;例2、乙村有8户人家,人口数: 2,3,4,7,9,10,12,12 求中位数和四分位差。;(2)根据频数分布表求四分位差;(3)分组资料;例4、调查某地区212个乡育龄妇女(15-44)节育情况;Md=26+ =30 Q25的位置=N/4=53 Q75的位置=3N/4=159 结论:有50%的乡的节育率是位于15.7%和51%之间,四分位差是35.3%。;三、标准差(Standard Deviation)和方差(Variance);【例5】求72、81、86、69、57的标准差和方差。;均值在计算中只是过渡步骤。为了简化计算,可对分子项做变换:;利用简化的公式同样可以得到相同的结果: 当均值取小数点后有限位时,简化公式的计算结果比原公式还要精确。;(2)根据频数分布;;(3)根据分组资料;四、标准分 (standard score);标准分数 (性质);标准分数 (性质);标准化值 (例题分析);经验法则;切贝谢夫不等式 (Chebyshev’s inequality );切比雪夫不等式 (Chebyshev’s inequality );【例】某人调查了200人的日平均收入,平均收入为80元,标准差为10元。问60-100元之间至少会有多少人? 解:用切贝谢夫定理,先算出 0.75×200=150,说明至少有150人在60-100元之间。;五、异众比率(Variation Ratio)VR;;Notice;六、离散系数 (Coefficient of Variation)CV;【例8】一项调查得到下列结果:某市人均月收入为92元,标准差为17元;人均住房面积7.5平方米,标准差1.8平方米。试比较该市人均收入和人均住房情况哪一个差异程度更大。;【例9】对广州和武汉两地居民生活质量调查发现,广州居民平均收入为680元,标准差为120元;武汉居民平均收入为360元,标准差为80元。问广州居民相互之间在收入上的差异程度,与武汉居民相互之间在收入上的差异程度哪一个更大一些?;六、小结;;第六节 偏态与峰态的测量;偏态与峰态分布的形状;一、偏态 (skewness);偏态系数 (skewness coefficient);偏态系数 (例题分析);偏态系数 (例题分析);偏态与峰态 (从直方图上观察);二、??态 (kurtosis);峰态系数 (kurtosis coefficient);峰态系数 (例题分析);数据的特征和测度

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档