《统计学原理》(第二版)课件CH4 样本信息的提取CH4(1).ppt

《统计学原理》(第二版)课件CH4 样本信息的提取CH4(1).ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

4.2.1异众比率1、异众比率的定义是指非众数组的次数之和在总次数中所占比重;异众比率主要用于衡量一组数据以众数为分布中心的集中程度,即衡量众数代表一组数据一般水平的代表性;异众比率主要适用于测度定类数据的离散程度.异众比率的数值越小,说明数据的集中程度越高,众数的代表性越大;反之,异众比率的数值越大,说明数据的集中程度越低,众数的代表性越小.2、异众比率的计算4.2.2极差与四分位差1、极差极差的定义也称全距,是一组数据的最大值与最小值之差,表示数据取值范围的大小.极差的计算极差是最简单的尺度统计量.极差一般只对未分组数据或单变量(单项式)分组数据计算.极差常在小样本场合使用.极差仅使用了样本中两个极端点的信息.极差未考虑数据的分布.极差的特点◎对定序数据离散程度的测度◎也称为内距或四分位间距◎上四分位数与下四分位数之差◎反映了中间50%数据的离散程度◎不受极端值的影响,没有充分利用原始数据◎用于衡量中位数的代表性2、四分位差3、方差和标准差◎数据离散程度的最常用测度值◎反映了各变量值与均值的平均差异◎方差是各变量值与其均值离差平方的平均,而标准差是方差的平方根.◎方差和标准差适用于定量数据,是根据全部数据值计算所的,反映每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的差异程度.定义*Location(Position)Concernedwithwherevaluesareconcentrated.Variation(Dispersion)Concernedwiththeextenttowhichvaluesvary.ShapeConcernedwithextenttowhichvaluesaresymmetricallydistributed.****第四章样本信息的提取4.1位置信息的提取4.3分布形态信息的提取4.2尺度信息的提取4.4相对信息的提取4.5统计图4.1位置信息的提取4.1.1众数

4.1.2中位数与四分位数

4.1.3平均数

4.1.4众数、中位数与均值的关系位置特征——集中趋势

(centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据1、众数的定义4.1.1众数一组数据中出现次数最多的变量值;适合于数据量较多时使用;众数可能存在也可能不存在;主要用于定类数据,也可用于定顺序数据和定量数据.调查某百货商场某一时段内某款男式皮鞋的销售情况,得到的数据如表所示.试根据表中数据计算该款男式皮鞋尺码的众数.2、众数的确定【例】对于组距分组数据或3、众数的特点※不受极端值的影响※众数具有不唯一性※众数提取的信息可能不充分※众数的代表性有时会很差次序统计量的一种,将数据按大小顺序排列起来而形成一个数列后,居于数列中间位置的那个变量值即为中位数,常用表示.4.1.2中位数与四分位数1、中位数中位数的定义定序数据的位置确定定量数据的中位数中位数的确定或未分组数据单变量分组数据组距分组数据定序数据的中位数解:中位数的位置为(50+1)/2=25.5从累计频数看,中位数在“中等”这一组别中,从而Me=中等某班统计学学生成绩分布等级学生数(人)向上累计频数(人)优秀良好中等及格不及格51020105515354550合计50—【例】数据与中位数的离差绝对值之和最小主要用于定序数据,也可用定量数据,但不能用于定类数据中位数的特点不受极端值的影响用于定量数据时,样本信息的提取并不充分2、四分位数四分位数的定义四分位数也称四分位点,是通过三个点将全部数据等分为四部分,其中每部分包含25%的数据.因此通常所说的四分位数是指处在25%位置上的数值(下四分位数)和处在75%位置上的数值(上四分位数).四分位数的确定未分组数据单变量分组数据组距分组数据排序后处于25

文档评论(0)

医药前沿 + 关注
实名认证
内容提供者

专业医药相关文档服务

1亿VIP精品文档

相关文档