- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 定量资料的统计描述
[教学要求]
了解:通过电脑实验了解定量资料的频数分布表的编制方法和分布规律;通过
电脑实验了解描述分布形态的偏度系数与峰度系数的计算和意义。
熟悉:熟悉利用统计图表描述定量资料的基本方法;熟悉制作统计图表的基本要求和规则;熟悉百分位数的计算方法。
掌握:掌握描述定量资料集中趋势的算术均数、几何均数、中位数的计算方法和适用条件;掌握描述定量资料离散趋势的极差、四分位数间距、方差、标准差
和变异系数的计算方法和适用条件;掌握常用统计图表的制作方法。
[重点难点]
第一节 频数与频数分布
一、离散型定量变量的频数分布
基本概念:离散型变量定义参见有关章节。此型变量的特点是:实测值之间有间断,或实测值可数。
特点:离散型定量变量的频数表即频数分布表,可直接反映该变量的分布规律。离散型定量变量的频数分布图可用直条图表达。
二、连续型定量变量的频数分布
基本概念:定义参见有关章节。此型变量的特点是:实测值之间没有间断,或实测值不可数。实测值之间的间断可以忽略时,也可近似地视为连续型变量。
特点:连续型定量变量各观察值的频数表不是频数分布表,不能正确反映该变量的分布规律,只有划分特定数值组段后的频数表才能成为频数分布表。连续型定量变量的频数分布图可用直方图表达,其纵坐标为频率密度,即频率/组距,直方图的面积之和等于1。
第二节 定量变量的特征数
一、描述集中趋势的统计指标
基本概念:由于同质性,所有实测值趋向同一数值的趋势称为集中趋势。
在应用中,有一些统计量常称为统计指标。
㈠ 算术均数
意义:算术均数简称均数,常用符号表示样本均数,μ表示总体均数。均数是描述一组数据集中趋势或平均水平的最常用统计指标。
计算:1.直接法(基于原数据)
其中, 为观察值。
2. 加权法(基于频数表)
其中, 为组段的频数,为组段的中值。=(组段上限+组段下限)/2。
适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。
㈡ 几何均数
意义:几何均数以符号G表示,常用来反映一组含多个数量级的数据的集中位置。
计算:1.直接法(基于原数据)
或
其中, 为观察值。
2. 加权法(基于频数表)
适用条件:适用于观察值变化范围跨越多个数量级的资料,尤其对数正态分布资料。
㈢ 中位数
意义:中位数常用符号M表示,是反映一组数据集中趋势的位置指标,在全部实测值中有一半数值比它小,有一半数值比它大。
百分位数常用符号表示,是排序后的全部实测值的某百等份分割值,即在全部实测值中有x%个数值比它小,有1-x%个数值比它大。中位数就是一个特定的百分位数,即M=P50。
计算:中位数为全部实测值排序后的中间数值或中间两个数值的算术均数。
直接法(基于原数据)
将n例数据按升序排列,其第i个数据用表示。
n为奇数时,
n为偶数时,
2. 内插法(基于频数表)
其中,L为欲求的所在组段的下限,i为该组段的组距,为该组段的频数,n为总频数,为该组段之前的累计频数。
其中,L为欲求的中位数所在组段的下限,i为该组段的组距,为该组段的频数,n为总频数,为该组段之前的累计频数。
频率 区间 ↑
?
适用条件:资料不限,但最常用于非对称分布的资料。
㈣ 众数
意义:全部实测值中出现次数最多的数值即为众数。
㈤ 调和均数
意义:全部观察值倒数的算术均数的倒数即为调和均数,常用符号H表示。
计算:
其中, 为观察值。
二、描述离散趋势的统计指标
基本概念:离散趋势或变异程度是指观察值之间参差不齐的程度。
㈠ 极差
意义:极差又称全距,常用符号R表示。极差反映一组数据的变异范围。用
极差反映数据的变异程度常常比较粗略和不稳定。
计算: R = 最大值-最小值
适用条件:资料不限。
㈡ 四分位数间距
意义:P75和P25分别称为上、下四分位数。四分位数间距Q是全部观察值中居中的一半数值散布的范围。用四分位数间距反映数据的变异程度比极差稳定。
计算: Q= P75-P25
其中,P75和P25的求法参见前述百分位数求法。
适用条件:资料不限。
㈢ 方差和标准差
意义:总体观测值的离均差平方和的算术均数称为总体方差,用σ2表示。总体方差的平方根称为
文档评论(0)