数值变量资料的统计分析21节.pptVIP

下载本文档

2
0
约1.21万字
约 59页
2018-04-20 发布于未知
举报
版权申诉

数值变量资料的统计分析21节.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

总体平均值95％可信区间的涵义是：对同一总体进行100次抽样，计算100个可信区间，其中有95个可信区间包含有总体均数，只有5个可信区间不包括总体均属。或者说，有95%的把握度把总体平均值参数μ包含在这一区间内。四　假设检验的基本思想和步骤上述抽样模拟试验表明，从同一总体中以固定n随机抽样，由于抽样误差的影响，样本平均值　与总体平均值　往往不相等；且任意两个样本平均值　与　间也往往不相等。因此在实际工作中遇到样本平均值与总体平均值　间不相等，或两个样本平均值　、间不相等时，要考虑存在两种可能性： ①由于抽样误差所致；两者实属同一总体。 ②两者属于不同总体。对此问题应如何作出判断？从发生的概率大小作出判断。统计学上把这一判断过程称假设检验(hypothesis testing)，或显著性检验(significance test)。这种判断不是绝对的。 * 下面我们用一例说明这个原则：两个盒子，各装有100个球. 小概率事件在一次试验中几乎不会发生. 一个盒子中的白球和红球数 99个白球一个红球 …99个另一盒中的白球和红球数 99个红球一个白球 …99个 * 统计量不同的两种可能其一：抽样误差 (偶然的、随机的、较小的) 其二：本质上的差别 (必然的、大于随机误差) 两种情况只有一个是正确的，且二者必居其一，需要我们作出推断。假设检验的基本步骤一、建立检验假设，确定检验水准二、选定检验方法，计算检验统计量三、确定P值，作出统计推断结论用下面例子说明假设检验的过程。例9-14 某地抽样调查了280名健康成年男性的血红蛋白含量，得到平均值为136.0g/L,标准差为6.0g/L.。已知正常成年男性的血红蛋白含量的平均值为140.0g/L。试问能否认为该地抽样调查的280名健康成年男性的血红蛋白含量平均值与已知正常成年男性的血红蛋白含量平均值不同？这是一个样本平均值与总体平均值比较的问题。问题：μ＝μ0？ (1)建立检验假设, 确定检验水准:α 检验假设有二个部分：无效假设(null hypothesis)：H0:μ＝μ0。假设两总体平均值相等(即样本平均值　所代表的总体平均值μ与已知的总体平均值μ0相等。　与μ0的差异仅由抽样误差所致；备择假设(alternative hypothesis)：H1：μ≠μ0。假设两总体平均值不相等。即样本平均值　所代表的总体均数μ与已知的总体均数μ0不相等。这是双侧检验，即可能μμ0或者μμ0。根据专业也可以设置单侧检验。这时备择假设规定为：　　　　H1: μμ0或者规定为H1:μμ0 确定检验水准:α检验水准(size of test) 或显著性水准(significance level)： α为选定的临界概率。指在无效假设条件下如果得到如此之差(μ -μ0)及更极端情形的概率P等于或小于α时，就拒绝无效假设H0, 接受备选假设H1。否则不拒绝无效假设H0。通常把这一临界概率定为α＝0.05。与α=0.05对应的临界值为双侧u0.05/2=1.96。单侧u0.05=1.645。即如果实际统计量u≥ uα时，则发生的概率P≤α，按检验水准α拒绝H0，接受H1。如果实际统计量u uα时, 则发生的概率Pα，不拒绝H0。由于从统计模拟得知，从同一总体抽样100个样本，有5个样本的样本平均值的u u0.05/2。应作出拒绝H0的决定。但这一决定是错误的。故又称α为犯I类错误的概率。 (2) 选定检验方法，计算检验统计量根据分析目的、设计方案和资料类型选用合适的检验方法，计算相应的统计量。设计方案有： 1. 样本平均值与总体平均值比较。 2. 两个样本平均值比较。 3. 配对设计的两样本平均差值的比较。检验方法有： σ已知或虽σ未知，但n足够大：用基于标准正态分布规律的u检验，计算u值。 2. σ未知，且n小：用基于t分布规律的t检验，计算t值。例9-14的资料为：属‘虽σ未知，但n足够大’情况，用u检验(书中用t检验) (3) 确定P值，作出推断结论。当ν很大时，t分布曲线趋近于标准正态分布曲线。 u(α=0.05)=1.96, ∵11.161.96, ∴P0.05. 在α=0.05水准上拒绝H0, 接受H1。差别有统计学意义。可以认为该地健康成年男性的血红蛋白含量平均值低于一般正常成年男性的血红蛋白含量平均值。这一统计学结