- 1、本文档共73页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学,基本知识,健康管理,培训,课件统计学,基本知识,健康管理,培训,课件
正态分布的意义 正态分布是参数检验的基础。参数检验包括t-test,ANOVA(方差分析)等。 如果一个大样本符合正态分布(近似正态),或者一个随机抽样的小样本来自一个正态分布的总体,这时候才能够采用正态分布。 样本的正态性检验 观察法(图示法) 1、P-P图 如果资料服从正态分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 判断方法:类似直方图 计算法 1.计算偏度系数(Skewness)和峰度系数(Kurtosis) 2.非参数检验方法 包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W 检验) 二、对定性数据(分类变量)的统计描述 定性资料:性别、种族、肤色、血型、患病与否、治愈与否、有无并发症…… 数据的特点:间断性,可以用“是/否,轻/中/重,A/B/C/D,1/2/3/4/5……”表示。 分类资料的描述 绝对数,或称计数(count) 相对数:两个数值之比。分为: 构成比(proportion),指一事物内部某一组成部分所占的比重。 学历 人数 构成比(%) 本科 99 0.14 大专 1248 1.74 中专 53521 72.65 无学历 18763 25.47 合计 73667 100.00 某地1992年护理人员学历构成 2.率(rate):在某一事件中,实际发生某一现象的观察数与可能会发生该现象的总观察数之比。用于说明某现象发生的频率或强度。如:患病率、发病率、感染率、治愈率、死亡率、病死率…… * * 病名 平均人口数 人数 死亡率(1/10万) 高血压 172665 40 23.2 冠心病 172665 11 6.4 脑卒中 172665 253 146.5 风心病 172665 38 22.0 某地某年四种常见心血管病死亡率 统计描述和推断的基本内容 统计描述 统计推断 应 用 计量资料 频数分布 集中趋势 离散趋势 统计图表 抽样误差、 标准误 t,u 检验 秩和检验 方差分析 正常值范围 可信区间 计数资料 相对数及其标准化 统计图表 二项分布Poisson 分布 U, ?2检验 秩和检验 对数线性模型 逻辑回归 Kappa检验 疾病统计 人口统计 寿命表 相关与回归 r b 统计图表 t检验 方差分析 * 测量偏倚又有称为信息偏倚的,或错分偏倚 * * I类错误与II类错误 描述性统计分析 认识你的数据——变量的类型 一般分为两类: 定量数据(quantitative data)和定性数据(qualitative data) 数量变量←→分类变量 计量变量:无等级计数变量和有等级分类变量(ordinal category)。 定量数据 定性资料 别名1 数值变量 分类变量 别名2 连续性变量 间断性变量 无等级 有等级 别名3 计量资料 计数资料 分类等级变量 特点 有度量衡单位 无度量衡单位 例子 身高、体重 性别,种族 疾病严重程度 一、对定量数据(连续变量)的统计描述 定量资料:年龄、身高、体重、血压、血脂、血糖…… 数据的特点:连续性的数字,分布有一定的特征。 频数及其分布 100名18岁健康女大学生身高的频数分布 身高组段 划记 频数 f 154~ 11 2 156~ 1111 4 158~ 11111,11111,1 11 160~ 11111,11111,111 13 162~ 11111,11111,11111,11111,11 22 164~ 11111,11111,11111,1111 19 166~ 11111,11111,11111 15 168~ 11111,1111 9 170~ 1111 4 172~174 1 1 合 计 100 * 频数:当汇总大量的数据时,把数据按区段分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。 通过直方图可以直观地了解频数的分布。 * ?频数分布的两个特征: 集中程度与离散程度 ?频数分布的类型: 对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态) ?频数表的主要用途: 1. 揭示分布类型
文档评论(0)