第4章 定量资料的统计描述20150904.pptx

  1. 1、本文档共126页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章定量资料的统计描述20150904概要1

定量资料的统计描述;定量资料的统计描述;抽样调查2005年某市102名高中男生引体向上完成次数 ;原始资料 以个体为对象收集的数据——排列杂乱无章 很难发现、总结出群体的特征和规律 分组整理,用简明扼要的形式来全面反映资料(群体)的特点 频数分布表 频数分布图 ;频数分布表与频数分布图;内容提要;频数表(frequency table)—分组整理 分组:将资料按照某种属性(分组标志)划分成不同的组别,也称为组段 频数(frequency):统计不同组别内发生的观察值个数;抽样调查2005年某市102名高中男生引体向上完成次数 ;取值为某实数范围区间的特定值 以变量取值为分组标志,并列出相应频数;表4.1 2005年某市102名高中男生引体向上完成次数的频数分布;例4.2;其值可以取在某个实数范围区间的任意值,即在某个实数范围区间连续存在 人为分割成若干个组段,再求频数 ;求全距R (range,也称极差):R=Max-Min 确定组数a:经验法,一般观察对象在50以下时可分5~8组,在50以上时可分9~15组 确定组距i:等距划分,i=R/a 确定组段:不重不漏(穷尽互斥)、半闭半开[Li, Ui) 统计频数,编制成表;求全距 (range / R):观察值中的最大值与最小值的差值即为全距(或极差) R=3254-2879=375(m/s) 确定组数a 公式法 经验法:一般观察对象在50以下时可分5~8组,在50以上时可分9~15组 本例拟分a =13组;确定组距i(class interval) :即每个组段包含的距离 不等距划分—专业意义 等距划分—i=R/a 原始数据精度向上四舍五入1位 本例i=375/13=28.8?30(m/s);确定组段:即确定各组段的上下限,明确各组段含义 穷尽原则(不漏) 互斥原则(不重);确定最小组段下限 最小组段必须包含最小值,根据最小值向上舍入1位 最小值2879,取第一组段下限为2870 根据最小组段下限和组距确定各组段范围 规定:半闭半开,含上限不含下限 第一组段2870~2900,第二组段为2900~2930 第一组段2870~,第二组段为2900~ 确定最大组段上限 最大组段必须包含最大值 最大值3254, 取3230~3260;统计各组段频数,计算频率和累计频率;内容提要;;累计频率图;内容提要;频数分布类型(分布形式) 揭示频数分布特征 集中趋势 离散趋势 便于进一步计算指标和统计处理 便于发现某些特大或特小的可疑值;频数的分布是否对称 对称分布:发生频数最多的位置在正中,左右两侧频数分布大致对称 偏态分布:频数分布不对称,发生频数最多的位置偏向一侧 正偏态分布:发生频数最多的位置偏向数值小的一侧 负偏态分布:发生频数最多的位置偏向数值大的一侧;图4.1 155名6月龄婴儿SOS值的频数分布;图4.2 2004年我国麻疹患者的年龄分布;219名乳腺癌患者康复期生存质量评分 ;频数分布类型(分布形式) 揭示频数分布特征 集中趋势 离散趋势 便于进一步计算指标和统计处理 便于发现某些特大或特小的可疑值;图4.1 155名6月龄婴儿SOS值的频数分布;图4.1 155名6月龄婴儿SOS值的频数分布;总结:分布形式与分布特征;分布形式与分布特征;;频数表、直方图是揭示资料分布形式的工具 其编制条件是什么? 当数据量较小时,应如何说明资料的分布形式? ;在分布形式中,主要讨论了单峰分布,即只存在一个集中位置 实际工作中会不会存在“多峰分布”? 如何理解和处理“多峰分布”?;定量资料 集中位置的描述指标;集中趋势(central tendency):一组数据向某一个位置聚集或集中的倾向 集中位置 说明数据的平均水平或中心位置 常作为群体中最有???表性的值与其它群体进行比较;集中位置的刻画指标:平均数(Average),根据计算方法和适用场合的不同,分为:;是一组数据中出现次数最多或频率最高的数 用Mo表示 缺点:可能不唯一、没有众数,较少使用;集中位置的刻画指标:平均数(Average),根据计算方法和适用场合的不同,分为:;是算术均数(arithmetic mean)的简称 表示符号 总体均数用?表示 样本均数用 表示 计算方法;图4.1 155名6月龄婴儿SOS值的频数分布;优点 计算简单、容易理解 均衡考虑了每个个体值的信息,利用信息全面 一组单峰对称分布资料中最有代表性的值 总体均数?是正态分布的一个重要参数;缺点 受极端值的影响大 不适用于偏态分布或分布不明 不适用于开口资料集中趋势的描述 产生原因:测量工具的测量范围 表现形式:一端或两端存在不确切值 特点:在资料中所占比例不会太高;均数的应用;集中位置的刻画指标:平均数(Average),根据计算方法

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档