- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 集中趋势测量法与离散趋势测量法 第三章 集中趋势测量法与离散趋势测量法 一、集中趋势测量法——了解主要特征,简化资料 集中趋势(central tendency),又称集中值:用来代表全体变量的典型变量值或特征值。 (一)众值(Mode):用具有频数最多的变量值来表示变量的集中值。例如:(男,10) (女,40) 对于连续型定距变量,如果变量在第i组具有最高的频次密度,则用第i组中心值 来代表变量的众值。 例如:(10-20岁,40) (20-30岁,50) 众值适用于任何层次的变量——定类、定序、定距变量,它特别适用于单峰对称的情况,也是比较两个分布是否相近首先考虑的参数。对于多峰图形,由于众值不唯一,一般不用它来讨论。 (二)中位值(median): 中位值是数据序列之中央位置的取值。 1、未分组数据 (1)根据原始资料求中位值——当原始数据较少时,直接将资料按大小顺序排队。 当观察总数N为奇数时:中位值 位于 的地方。 当观察总数N为偶数时:中位值取居中位置左右两数的平均值。 例如: 2、3、4、7、9、10、10 1、2、2、3、3、4 2.5 (2)根据频次分布表求中位值 先求出累计频次,再找到位于 位置的取值。 中位值对于变量层次在定序以上(定序变量、定距变量)的都可以使用。定序变量一般采用中位值比众值更为精确。 成绩 频次 频率 累计频率(cf↓) 甲 乙 丙 丁 85 0.17 195 0.39 210 0.42 10 0.02 1.00 0.83 0.44 0.02 2、分组数据: 通过累计百分比中的50%点求出: (1)根据统计表中的累计百分比, 找出含有50%的区间。 (2)求出含有50%区间的上界值U、 下界值L、上界累计百分数U%、 下界累计百分数L%和组距h。 (3)利用线性插值法, 求出累计百分数为50%的变量值。 真实组界限 频次 累计频次 累计百分比C%↑ 0.2-0.4 0.4-0.6 0.6-0.8 下界值L←0.8-1.0 →上界值U 1.0-1.2 121 182 363 545 36.3→下界累计百分比L% 54.5 →上界累计百分比U% U L Md L% U% 50% (三)均值(Mean)——仅适用于定距变量 1、未分组数据 (1)根据原始资料求均值 95,90,98,80 (2)根据频次分布求均值 人口数 频次(户) 1 2 2 6 3 14 4 2 2、分组数据:可以用组中心值来代替变量值。 看电视时间(小时) 频次 中心值 0-2 2-4 4-6 7 2 1 1 3 5 (四)众值、中位值和均值的比较 1、三值都是通过一个数值来描述整体特征,以便简化资料,都是反映了变量的集中趋势。一般说: 众值:适用于定类、定序和定距变量; 中位值:适用于与定序和定距变量; 均值:适用于定距变量。 2、众值仅使用资料中最大频次这一信息;中位置考虑了变量的顺序和居中位置;均值既考虑频次,又考虑变量值的大小,因此均值是最灵敏的。 3、均值对资料的信息利用最充分,但对于严重偏态的分布,会失去应有的代表性
文档评论(0)