- 1、本文档共126页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章定量资料的统计描述20150904概要1
定量资料的统计描述;定量资料的统计描述;抽样调查2005年某市102名高中男生引体向上完成次数
;原始资料
以个体为对象收集的数据——排列杂乱无章
很难发现、总结出群体的特征和规律
分组整理,用简明扼要的形式来全面反映资料(群体)的特点
频数分布表
频数分布图
;频数分布表与频数分布图;内容提要;频数表(frequency table)—分组整理
分组:将资料按照某种属性(分组标志)划分成不同的组别,也称为组段
频数(frequency):统计不同组别内发生的观察值个数;抽样调查2005年某市102名高中男生引体向上完成次数
;取值为某实数范围区间的特定值
以变量取值为分组标志,并列出相应频数;表4.1 2005年某市102名高中男生引体向上完成次数的频数分布;例4.2;其值可以取在某个实数范围区间的任意值,即在某个实数范围区间连续存在
人为分割成若干个组段,再求频数
;求全距R (range,也称极差):R=Max-Min
确定组数a:经验法,一般观察对象在50以下时可分5~8组,在50以上时可分9~15组
确定组距i:等距划分,i=R/a
确定组段:不重不漏(穷尽互斥)、半闭半开[Li, Ui)
统计频数,编制成表;求全距 (range / R):观察值中的最大值与最小值的差值即为全距(或极差)
R=3254-2879=375(m/s)
确定组数a
公式法
经验法:一般观察对象在50以下时可分5~8组,在50以上时可分9~15组
本例拟分a =13组;确定组距i(class interval) :即每个组段包含的距离
不等距划分—专业意义
等距划分—i=R/a
原始数据精度向上四舍五入1位
本例i=375/13=28.8?30(m/s);确定组段:即确定各组段的上下限,明确各组段含义
穷尽原则(不漏)
互斥原则(不重);确定最小组段下限
最小组段必须包含最小值,根据最小值向上舍入1位
最小值2879,取第一组段下限为2870
根据最小组段下限和组距确定各组段范围
规定:半闭半开,含上限不含下限
第一组段2870~2900,第二组段为2900~2930
第一组段2870~,第二组段为2900~
确定最大组段上限
最大组段必须包含最大值
最大值3254, 取3230~3260;统计各组段频数,计算频率和累计频率;内容提要;;累计频率图;内容提要;频数分布类型(分布形式)
揭示频数分布特征
集中趋势
离散趋势
便于进一步计算指标和统计处理
便于发现某些特大或特小的可疑值;频数的分布是否对称
对称分布:发生频数最多的位置在正中,左右两侧频数分布大致对称
偏态分布:频数分布不对称,发生频数最多的位置偏向一侧
正偏态分布:发生频数最多的位置偏向数值小的一侧
负偏态分布:发生频数最多的位置偏向数值大的一侧;图4.1 155名6月龄婴儿SOS值的频数分布;图4.2 2004年我国麻疹患者的年龄分布;219名乳腺癌患者康复期生存质量评分 ;频数分布类型(分布形式)
揭示频数分布特征
集中趋势
离散趋势
便于进一步计算指标和统计处理
便于发现某些特大或特小的可疑值;图4.1 155名6月龄婴儿SOS值的频数分布;图4.1 155名6月龄婴儿SOS值的频数分布;总结:分布形式与分布特征;分布形式与分布特征;;频数表、直方图是揭示资料分布形式的工具
其编制条件是什么?
当数据量较小时,应如何说明资料的分布形式?
;在分布形式中,主要讨论了单峰分布,即只存在一个集中位置
实际工作中会不会存在“多峰分布”?
如何理解和处理“多峰分布”?;定量资料集中位置的描述指标;集中趋势(central tendency):一组数据向某一个位置聚集或集中的倾向
集中位置
说明数据的平均水平或中心位置
常作为群体中最有???表性的值与其它群体进行比较;集中位置的刻画指标:平均数(Average),根据计算方法和适用场合的不同,分为:;是一组数据中出现次数最多或频率最高的数
用Mo表示
缺点:可能不唯一、没有众数,较少使用;集中位置的刻画指标:平均数(Average),根据计算方法和适用场合的不同,分为:;是算术均数(arithmetic mean)的简称
表示符号
总体均数用?表示
样本均数用 表示
计算方法;图4.1 155名6月龄婴儿SOS值的频数分布;优点
计算简单、容易理解
均衡考虑了每个个体值的信息,利用信息全面
一组单峰对称分布资料中最有代表性的值
总体均数?是正态分布的一个重要参数;缺点
受极端值的影响大
不适用于偏态分布或分布不明
不适用于开口资料集中趋势的描述
产生原因:测量工具的测量范围
表现形式:一端或两端存在不确切值
特点:在资料中所占比例不会太高;均数的应用;集中位置的刻画指标:平均数(Average),根据计算方法
您可能关注的文档
最近下载
- 期末考试—服务方案策划与评估形考任务二.docx VIP
- 班组劳务分包合作协议.doc VIP
- [山西]2024年山西医科大学第二医院招聘42人笔试历年典型考题及解题思路分析附带答案详解.docx VIP
- 《22G101三维彩色立体图集》.pdf VIP
- 游泳池设计规范.docx
- 【会写生字250字】部编人教版二年级上册语文生字表笔顺练习可打印.doc
- 《JTT695-2007-混凝土桥梁结构表面涂层防腐技术条件》.pdf
- 人教小学生必背古诗75首(带拼音打印版).pdf VIP
- 牛津指导写作的系列oxford-discover-2-Writing-and-Spelling.pdf
- A3微能力点优秀案例汇编.docx VIP
文档评论(0)