- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会研究的统计应用6.ppt
两大类统计推论:参数估计,假设检定 参数估计:从样本的统计值来估计总体之参数值:研究10000人的每月文娱平均支出 1)随机抽取200人作为样本, 2)从中计算出平均值为42.5元, 3)则称10000人的平均每月文娱支出为42.5元) 假设检定(假设检验):先假定总体的情况,然后抽样,计算统计值来检验这个假定是否正确 1)先假定每月文娱平均支出为40元, 2)随机抽取200人作为样本, 3)从中计算出为42.5元, 4)根据抽样分布理论作出接受或否定最初的假定的结论 参数估计是从局部情况推出总体情况 假设检定是先假定全部情况,然后从局部情况决定是否接受最初的假定 第六章 参数值的估计 以样本的统计值来估计总体的参数值,分为两大类做法: 点值估计(点估计) 间距估计(区间估计) 第一节 点值估计与间距估计 点值估计:以一个最适当的样本统计值(由样本计算出的值)来估计总体的某个参数值 意义:了解某地青年人有多少赞成一胎化政策,现随机抽取一个青年人的样本。发现有60%赞成,我们将这个值代替总体的赞成比率,这就是参数(赞成一胎化政策)的点值估计,即认为总体的赞成率也是60% 点值估计的实际意义不大。 间距估计:先给出可信度( 95%),利用样本计算,估计出一个区间 [a , b],使我们要估计的参数落在该区间的可信度为(95%),即100次抽样有95次落在这个的区间里 可信度一般选为95%或99% 第二节 间距估计(区间估计):均值、百分率、积矩相关 1.均值的间距估计(样本:1,3,5) 样本均值:X =∑x/n (1+3+5)/3=3 样本标准差:S=[∑(x-X) 2/n]1/2 [(1-3)2+(3-3)2+(5-3)2/3]1/2 =(4/3)1/2 分布的标准差 SE=S/n ? =2/3 数学理论证明:均值的抽样分布服从正态分布 N( X ,SE) 由第五章的结论:所抽出的样本均值满足以下式子: 由抽样计算出来的均值有95%落在M±1.96(Se) 之间,用X代替M得出结论: 抽样均值落在一个可由样本来计算的区间: [X-1.96(SE),X+1.96(SE)]的可信度为95% 间距估计的计算公式: 如果设可信度为95%,可用公式来计算可信间距 X - 1.96(SE)=M=X+1.96(SE) 如果设可信度为99%,可用公式来计算可信间距 X – 2.58(SE)=M=X+2.58(SE) SE=S/n1/2 例:统计一个地区的家庭用于请客送礼的每月平均支出(M) 抽取出的一个样本为n=225,通过抽样得到数据,计算出样本均值 X=43, 样本标准差 S=10.5 SE=S/15 1.96*SE=1.96*10.5/15=1.37 则可信度为95%的可信间距为 [43-1.37,43+1.37]= [41.19, 44.81] 有95%的信心,估计总体的均值在上述区间 课堂练习:要统计一个学校的学生平均每月生活费(M) 抽取出的一个样本大小为n=256 计算出样本均值X=550, 样本标准差S=250.5,则抽样分布的标准差SE? 则可信度为95%的可信间距为? 答案 SE=S/n1/2=250.5/16=15.66 [550-1.96*15.66, 550+1.96*15.66] [ 519.31, 580.69 ] 2.百分率(或比例)的间距估计 估计某个指标占总数的百分比(二项分布) 己知样本大小n,样本比例p,计算 样本标准差:S=[p(1-p)]1/2(由二项分布性质), 分布的标准差 SE=S/n ?=[p(1-p)/n]1/2 计算公式 要求95%的可信度,则可信间距公式为 [ p-1.96(SE), p+1.96(SE) ] 要求99%的可信度,则可信间距公式为 [ p-2.58(SE), p+2.58(SE) ] 例子:估计某城镇有多少家庭是夫妻不和。从一个随机样本(n=100)知道有20.0% (p=0.200)的家庭不和,如果要求可信度是95%,则 1.96*SE =1.96* [p(1-p)/n]1/2 = 1.96* [0.2(1-0.2)/100]1/2=0.0782 可信间距为 [0.200-0.078, 0.200+0.078]=[0.122,0.278] 结论:有95%的把握认为该城镇夫妻不和比率在12.2%到27.8% 之间 3.估计积矩相关系数值(r) 问题:如果在随机样本中发现X与Y
文档评论(0)