第二章单变量的统计描述分析社会统计学.pptVIP

第二章单变量的统计描述分析社会统计学.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实际上基本公式为: 例:72,81,86,69,57,N=5 6561,7396,4761,3249. * 离散系数:概念要点和计算公式 1.标准差与其相应的均值之比 2.测度了数据的相对离散程度 3.用于对不同组别数据离散程度的比较 4.计算公式为 例如 ∴ 代表性高 * 离散系数:实例和计算过程 表3-6 某管理局所属8家企业的产品销售数据 企业编号 产品销售额(万元) X1 销售利润(万元) X2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 【例3.15】某管理局抽查了所属的8家企业,其产品销售数据如表3.6。试比较产品销售额与销售利润的离散程度 * 离散系数:计算结果 X1=536.25(万元) S1=309.19(万元) V1= 536.25 309.19 =0.577 S2=23.09(万元) V2= 32.5215 23.09 =0.710 X2=32.5215(万元) 结论: 计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度 * 数据类型与离散程度测度值 表3-7 数据类型和所适用的离散程度测度值 数据类型 定类数据 定序数据 定距数据或定比数据 适 用 的 测 度 值 ※异众比率 异众比率 异众比率 — ※四分位差 四分位差 — — 极差 — — 平均差 — — ※离散系数(比较时用) — — ※方差或标准差 习题 一、根据以下统计资料:汉族,50,000人,苗族22,000人,布衣20,000人,藏族1,000人,问能制成哪些统计图?对变量值的排列是否有要求? 二、直方图的高度有什么意义?什么情况下,直方图的高度也可用频次或频率来表示? 三、抽查50名学员,他们的统计学成绩如下: 试以10分为组距,用划记分法编制次数分配表,并绘制直方图。 五、将习题四的50名学员统计学成绩接下表分组 四、(续) (1)计算并填充频率栏和累积频率栏 (2)哪几组是开口组?计算其组中值 (3)第三组的实际组限是多少? (4)第二组的表面组限是多少? (5)第四组的组中值是多少? 五、将空白处填充有关数据(单位:厘米) 六、以下是甲乙两村九户家庭人口数的原始数据 甲村:3;3;4;4;4;5;6;7;8 乙村:3;3;4;4;4;4;5;5;5 (1)计算两村家庭人口数的众值、中位值和均值 (2)对三种集中值作出讨论 七、以下是68名职工婚姻状况的调查 N“未婚”; M“已婚” D“离婚”; W“丧偶” 选择适当的集中值和离散值,并讨论之。 八、设以下是72名离婚者婚龄的统计 (1)试作直方图 (2)试求众值、中位值和均值并作简单讨论 (3)试求四分位差和标准差 * * * * * * * * * 例:调查了200名大学生,内心的苦恼倾诉对象意愿为: 党团组织41人、家长49人、知心朋友52人、闷在心里32人、 班团干部15人、随便议论11人 可见N=200 fmo=52 V= 众数的代表性很低 注意:众值与众值频数,即MO与fmo的区别。 二、极差(全距) 定义:一组数据的最大值与最小值之差 例如:数据72,81,86,69,和57的极差为:86与57之差等于29。 如果数据已被分组,则极差取为极端类别的中点之差 例: 青年人阅读小说书的数目 则极端类别的中点为3和18 极差R=18-3=15 优点: 计算简单,并且一目了然,特别是对外行来说,极差是唯一可理解的离差量度。 缺点: 它仅仅以两个个案为依据,而且是两个极端的个案,数据利用率低,信息丧失严重。另外,极差随着样本的变化而变化很大,一般来说大样本的极差比小样本更大一些。 * 三、四分位差,检验中位数代表性高低 1. 排序后处于25%和75%位置上的值 2. 不受极端值的影响 3. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据 Q25 Q50 Q75 25% 25% 25% 25% 计算方法,是将个案由低至高排列,然后分为四个等分(即每个等分包括25%的个案;则第一个四分位置的值(Q1)与第三个四分位置的(Q3)的差异,就是四分位差(简写Q),公式是Q=Q1-Q3) 25% 25% 25% 25% 低 Q1 Q2

文档评论(0)

wendan118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档