- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从群体的角度,描述定性变量的分布特征的指标
绝对数:群体中发生某事件(某类别)的频数
相对数:率或构成比
抽样研究中,亦为样本统计量
分布:变量X的取值(或取值范围)与其发生概率间函数表达形式;频数:数值只能用自然数或整数单位表达——离散型变量(discrete variable)
常见描述离散型变量取值及其概率的分布形式
0-1分布(0-1 distribution)
二项分布(Binomial distribution)
泊松分布(Poisson distribution)
超几何分布(Hypergeometric distribution);对某化学制品的毒性进行鉴定
设某化学制品对小鼠的致死率为60%
对符合实验要求的3只小鼠注射规定剂量的该化学制品
观察指标:是否死亡,即死亡或未死亡
计算在本次毒性试验中2只小鼠死亡的概率P(2);该化学制品的毒性试验—利用3只小鼠重复试验该化学制品的毒性
每次观察(每只小鼠)只有两种可能结果—死亡或未死亡
每次观察(每只小鼠)死亡的概率P(死亡)=?,且保持不变
每次观察(每只小鼠)结果间彼此保持独立;瑞士数学家Jakob Bernoulli所发展
每一次试验只有两个结果,一个记为“发生”,一个记为“未发生”,P(发生)=?,P(未发生)=1-?
发生的概率? 在每次试验中保持不变
各次试验之间相互独立
;一次Bernoulli试验中,事件的发生次数Y取值为0或1
则Y的概率分布形式为:
称Y服从参数为?的两点分布,记作X~B(1, ?);事件的发生次数X的分布服从参数为n、?的二项分布(binomial distribution),记作X~B(n, ?)
本例:X~B(3, 0.6);3只小鼠注射规定剂量的该化学制品,该化学制品对小鼠的致死率为60%
“死亡数”X不能确定,0, 1, 2, 3都有可能发生
在n重伯努利试验中,发生次数为变量
记为X,X=0, 1, 2, …, k, …, n
“死亡数”的发生概率
;可能的死亡数;n重Bernoulli 试验中,X为事件A在 n 次试验中发生的次数 ,P (A) =? ,若:
则称X服从参数为n, ?的二项分布,记作X~B(n, ?)
两点分布是二项分布n=1时的特殊形式
在n重Bernoulli试验中,发生某种结果A(如死亡)次数的一种概率分布
;在n重试验中发生的次数X服从参数为n, ?的二项分布;本例X~B(3, 0.6);X~ B(3,0.6);分布形式
当? =0.5时,二项分布图形是对称的
当? ?0.5时,图形是偏态的
随着n的增大,图形趋于对称
当n?+?时,只要?不太靠近0或1,近似于正态分布
当n?和n(1-? )都大于5
分布特征
集中趋势
离散趋势;反映随机变量的平均取值大小,又称数学期望,即均数?
是以相应概率作为“权重”的加权平均
;度量随机变量偏离(背离)数学期望(即均数) 程度的指标
实际值与期望值之差平方的期望值
偏离平均值的平均偏离程度
;分布形式;正态近似(德莫佛—拉普拉斯中心极限定理);;定量变量;在n次实际观测中,发生概率为?的某事件发生次数X及其发生频率p的分布形式
考察二分类(发生/未发生)定性变量的分布特征
抽样研究
一般发生概率?未知
有关样本统计量(发生次数X及其发生频率p)的分布形式
说明样本统计量与其相对应的总体参数间的关系
;二项分布及其近似正态 分布的应用;抽样研究中利用样本信息推断未知的总体特征
抽样误差客观存在
参数估计:p??
假设检验:利用样本信息完成总体率的比较
单样本率与已知率的比较
独立样本率的比较
配对样本率的比较;点估计:p??
区间估计
在给定的置信水平(1-?)条件下,利用特定的分布形式,估计总体参数所在的区间,该区间为可信区间或置信区间;精确估计
利用分布形式:二项分布
一般适用条件:n?50
估计方法:查附表7:百分率的置信区间(P328)
据GB/T 4088-2008 数据的统计处理和解释—二项分布参数的估计与检验
当n10时,置信区间一般太宽,无应用价值
;例10.4 某医院肿瘤科收治某种罕见肿瘤患者40例,1年内死亡5例。试估计该病年病死率。
点估计:该病年病死率为12.5%
区间估计:n=4050,根据n=40, x=5, 1-?=0.95查附表7:百分率的置信区间(P447),得:
95%置信区间为:(4%~27%);正态近似法
利用分布形式:近似正态分布
条件: n?+?时,只要?不太靠近0或1?当np和n(1-p)都大于5时
估计方法:;例10.3 某医院用注射用阿奇霉素对110名儿童肺炎患者进行治疗,其中痊愈50例,试估计注射用阿奇霉素治疗儿童肺炎痊愈率的95%置信区间。
痊愈人数
文档评论(0)