第二章 数据的整理与统计描述.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数据的整理与统计描述

第二章 数据的整理与统计描述 第二章 数据的整理与统计描述 第一节:统计数据的整理 第一节:统计数据的整理 一、统计表与统计图 二、定性数据的整理 三、定量数据的整理 一、统计表与统计图 一、统计表:将统计数据及其指标以表格列出,它可代替冗长的文字叙述,便于资料间的对比。 统计表-结构 表号 表题(包括何时、何地、何事) 统计图-结构 统计图-种类- 1、条图 统计图-种类- 2、圆图 圆图:是以圆形总面积作为100%,将其分割成若干个扇面,表示事物内部各构成部分所占的比例。它用于表示事物内部的构成情况 。 统计图-种类- 3、线图 线图:用线段的升降表达一事物(发病率、死亡率或均数)随另一事物(时间、年龄)数量变化的趋势,最常用于描述统计量随时间变化而变化的趋势。 统计图-种类- 4、直方图 直方图:用各矩形(宽度为组距)的面积表示各组段的频数或频率,用于表示连续变量的频数分布。 统计图-种类- 5、散点图 散点图:用点的密集程度和散布趋势表示两指标或两变量间的相关关系。 二、定性数据的整理 三、定量数据的整理 对于定量数据(数值数据)主要作分组整理-组距式分组法。 定量数据统计整理的目的是了解定量数据的分布规律和类型,并根据分布类型选用的统计指标描述集中趋势、离散程度及形状等统计指标。 极差(range): 极差也称全距,即最大值和最小值之差,记作R。本例 绘制直方图 横坐标——指标(药片含药量) 纵坐标——频数密度即频数/组距或频数(等组距频数表) 频数表与频数分布图的用途 3、描述资料的集中趋势与离散趋势 频数表与频数分布图的用途 一、均数(mean) 意义:用于反映一组呈对称性分布的变量值在数量上的平均水平或者说是集中位置的特征值。 均数的性质: ① 样本各个观察值与平均数之差的和为零,即离均差之和为零; 均数的计算方法与作用 讨论:随机变量X的平均数(数学期望)(P53) 二、几何均数(geometric mean) 几何均数的 计算: 例2-2 测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度。 中位数的计算 四、百分位数( percentile ) 百分位数是一种位置指标,用 来表示。 一个百分位数 是将全部变量值分为两部分,有 的变量值比它小,有 变量值比它大。 百分位数计算 百分位数计算 众数、中位数和均值的关系 常用平均数的意义及应用场合 描述离散趋势的特征数 变异指标:描述一组变量值的变异程度或离散趋势的指标. 不同的分布使用不同的变异指标 (二) 四分位数间距 (三)方差(Variance)与标准差(standard deviation, Sd) 样本标准差不以样本容量n而以n-1作为除数。这是因为通常我们只能掌握样本资料,不知道总体平均数的数值,不得不用样本平均数代替总体平均数。但由于离均差平方和最小,即 用加权法计算例2-1资料的标准差 讨论:随机变量X的方差(P57) 从频数资料得到样本方差或标准差 思考题 1.从同一总体中随机抽出的不同样本其平均数和方差是否相同,为什么? 2.制作频数表与频数分布图的用途是什么? 3.指出描述数据集中趋势的各平均数分别适用于何种资料? 4.指出描述数据变异趋势的各变异数分别适用于何种资料? 5.如何用EXCEL进行统计数据整理和计算样本特征数? 所谓X或X的函数的平均数(理论平均数),即它们的数学期望 随着n的充分增加,平均数稳定于总体平均数μ 对于频数资料的样本平均数 (1)设C是常数,则 E(C)=C 。 (2)若k是常数,则 E(kX)=kE(X)。 (3) (4)设X、Y相互独立,则有 E(XY)=E(X)E(Y)。 应用: 常用于等比资料,主要用于血清学和微生物学中; 用于对数正态分布资料(原始数据不对称,但各变量值取对数后呈对称分布的资料); 观察值不能有0; 观察值不能同时有正值和负值。 三、中位数(median) 定义:资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。 M 平均数 用途:偏态分布资料;一端或两端无确切数值的资料(开口资料);分布不明的资料。 3、在EXCEL中计算中位数的函数为: MEDIAN(number1,number2,...) 2、频数表法 (大样本) LM ,iM ,fM分别为M 所在组段的下限、组距和频数,?fL为M 所在组段之前各组段的累积频数。 1) 当观测值个数n为奇数时 2) 当观测值个数n为偶 数 时,即: 1、直接计算法 (小样本时) 12 12 10.08

文档评论(0)

qwd513620855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档