- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
統计学总结
一章 绪论
同质:是指被研究指标的影响因素相同。实际工作中,影响被研究指标的主要的可控制的因素达到相同或基本相同就可认为是同质。
变异:同质观察单位之间的差异,是生物界的重要特征,是产生随机现象的根本原因。
总体:根据研究目的所确定的研究对象的全体称总体。更确切的讲,是指根据研究目的所确定的全部同质观察单位某项变量值的集合。
总体分类:
有限总体:在确定的时间和空间范围内包括有限个观察单位。如:
无限总体:没有时间和空间的范围限制,观察单位数不确定。如
样本:研究对象的一部分称样本。(要求从总体中随机抽取的有代表性的一部分)
根据研究范围,总体与样本是一个相对的概念。
误差(error)
实测值与真值之差,或样本指标与总体指标之差。
误差分类: 随机误差:(又分抽样误差、重复误差)
系统误差 (可避免)
过失误差
抽样误差(sampling error):由于抽样所致样本指标与总体指标的差异(主要由变异引起),是客观存在的。
特点:①无倾向性
②不可避免
③可估计大小,主要受样本含量大小的影响
随机误差呈正态分布,可用医学统计学方法进行分析。
参数:总体指标,多用希腊字母表示。如:m、s、p
统计量:样本指标,多用拉丁字母表示。如:`X、S、P
变量:指观察单位的某种特征。能够反应观察单位的变异性。如:性别、身高、体重、红细胞计数等
变量值(或观察值):对变量的测量的具体数值大小。
变量分类:1、定量变量: {1 离散型变量2、连续型变量 }
2、定性变量: {1、 分类变量\名义变量(最常见)、 2、有序变量\等级变量}
二分类变量是最简单最常用的分类变量、
九章卡方检验
χ2检验的基本思想:用统计量度量实际频数和理论频数之间的偏离程度(χ2反映了实际频数与理论频数的吻合程度)
χ2检验的应用条件
(1)当n≥40且T≥5时,用χ2检验的基本公式或四格表的专用公式;当P≈α时,改用四格表的确切概率法。
(2)当n≥40时但有1≤T<5时,用四格表χ2的校正公式或用四格表的确切概率法
(3)当n<40时,或T<1时,用四格表的确切概率法
χ2检验的步骤:1、建立检验假设,确定检验水准2、计算χ2统计量和自由度3、确定P值,做出推断
二章定量资料的统计描述
频率表:列有各观察单位的变量值及相应的频数的表格。
频率表的用途: 1可揭示资料的分布特征和分布类型
2便于进一步计算和统计分析处理
3便于发现某些特大、特小的可疑值
4描述分布的集中趋势和离散趋势
5样本含量足够大时,以频率作为概率的估计值
频率表的编制步骤
1计算极差(全距,range): R=最大值-最小值=162.6-125.9=36.7
2确定组距与组段数:i≈R/10= 3.67~4.0 总之,组段和组距的选取以方便阅读和计算为原则。(尽量取“整数”)最小组段包含最小值,最大组段包含最大值。
3确定各组段的上下限
4列表
反映集中趋势的指标--- 平均数, 平均数用于说明一组观察值的平均水平或集中趋势,常用的有: (1.算术均数2.几何均数3.中位数)
1算数均数:用于对称分布,特别是正态分布资料
计算方法:①直接法(n较小)
`X =(x1+x2+x3+… +xn)/n=SX/n②加权法(n较大) `X=(f1x1+f2x2+f3x3+… +fixi)/(f1+f2+f3+… +fi) =Sfixi/Sfi
算术均数的特征
①各离均差之和等于0 (x1-`x)+(x2-`x)+(x3-`x)+…+(xn-`x)=S(xi-`x)=0
②各离均差之平方和小于各变量值与任一数之差 S(xi-`x)2 S(xi-a)2 (`x≠a)
2几何均数:适用于可经对数转换为对称分布的资料
注意:资料中不能有0或同时有正和负数
①直接法(n较小) G=√x1x2x3… xn=㏒-1(∑㏒X)
②加权法(n较大) G= ㏒-1(∑f㏒X)
3中位数|:一组数据按大小顺序排列,位置居中的这个数即为中位数 。用M表示。中位数是一个位置指标,以中位数为界将观察值分为左右两半(适用于各种分布的资料,特别是偏态分布资料)
1、于反映偏态分布资料的集中趋势,也可用于正态分布资料
2、用于开口资料,即资料的一端或两端没有确定的数据(大于或小于)
3、用于分布类型不清楚的资料
百分位数P50是中位数
反映离散趋势的指标: (1. 极差 (R又称全距)2. 四分位数间距(Q)3. 方差(variance)4、标准差(standard deviation)5、变异系数(Coefficient of Va
文档评论(0)