- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章抽样与统计推论1
第三篇;第五章:抽样与统计推论
第六章:参数值的估计
第七章:假设检定:均值与百分率
第八章:假设检定:两个变量的相关;回顾:;第一节 抽样的意义;社会研究的过程;
统计叙述:描述变量或者变量之间的关系。无论数据怎么来的,是样本还是总体的数据,无论随机样本还是非随机样本,统计叙述的方法都可以使用。关注样本的情况。
统计推论:根据样本的情况,来推测总体的情况。
关注总体的情况。
;两套话语:样本与总体。
从样本中计算出来的数值称作统计值,
在总体中计算出来的数值称为参数值。
我们的目标是:总体的状况。
我们的手段是:从样本推论总体,或者从样本中归纳总体。;问题:在对一个变量或者两个变量的分布状况,或者相关关系的分析中得出的统计值。代表的这种分布或者关系是不是在总体中也是这样?;第二节 抽样的历程;总体
抽样框
样本大小
决定样本大小的一般原则:根据研究能付出的最大代价抽取样本。
抽样比例
设计抽样方法,抽取样本
评估样本:总体分布与样本分布在基本特征上是否分布一致。
;第三节 随机与非随机抽样法;;第四节 几率与抽样分布;社会学研究抽样调查的目的是通过样本推算总体的情况。
归纳法的结论不可能百分百正确。概率论(几率论)即是研究我们通过样本推测总体的时候所犯的错误是多少。;通过概率论,可以知道在一定条件下,总体中的各种抽样结果所具有的概率特征。
统计推论是研究在发生了某种抽样结果的情况下,判断它来自何种总体更合适。
统计推论是概率论研究的逆问题。;一、随机现象
客观现象可分为确定现象和非确定现象。
随机现象-非确定现象
在一定条件下,事物的出现只有可能性但不具有必然性。可能而又不必然,意味着在一定条件下出现的结果不止一种,其中任何一种情况的出现 都具有一定的随机性。;确定性现象——必然命题,表示为:
若……,则……
非确定性现象——随机命题,表示为:
若……,可能……
社会学研究多为随机命题。
;;;;;
频率是实验值,它随着试验或者观察而变化,具有随机性,只能近似反映事件出现可能性的大小。
概率是理论值,它由事件的本质决定,值是唯一的,能精确地反映出事件出现可能性的大小。;;;;随机事件尽管具有随机性,但是对于一个确定的随机样本来说,我们得到的是确定的观测值,这些值是确定的,根据这些值计算出来的数值叫做统计值。
而抽样分布是在概率论的基础上成立的理论分布,是在假定如果在同一总体中反复不断抽取不同样本时,各个可能出现的样本统计值的分布状况。;概率,将随机事件与一个精确反映事件出现可能大小的数量紧密联系在一起。假设试验或者观测进行了无限多次。
概率分布,假设进行无数次抽样,得到那个最为完美的样本的分布状况。将变量取值分布和一个固定的形状联系起来。
;;极限定律有两类:
大数定律:有关阐明大量随机现象平均结果的稳定性的一系列定理,研究在什么条件下随机事件可以转化为不可能事件或者必然事件。
中心极限定理:研究在什么条件下随机变量之和的分布可以近似正态分布。
偶然性与必然性的辩证关系
大数定理将局部、偶然的影响消除掉,使共同的原因显现出来。
;最重要的两个抽样分布:
二项抽样分布
均值抽样分布;一、二项分布;一、 二点分布
变量的取值只有两类。两个类别习惯上用0和1来表示,又叫做0-1分布。
在社会调查中有大量的二分变量。
二点分布是二项分布只做一次观察的概率分布。;二点分布——是与否
“是”的概率为P(取值为1的时候、成功),“否”的概率为Q。(取值为0的时候、失败)
特征:
P(0)0 ; Q0
P+Q=1
对于性别、抛硬币等来说,P=Q=0.5
其他状况P不一定等于Q。
;;二、 二项分布
当试验进行n次的时候,成功的次数呈现一种概率分布。;抛五次硬币的概率分布图;当试验次数或者观测个案n无限大的时候,频率的分布接近于理论的概率分布;二项分布的特征:
离散型分布,当试验次数为n时,二项分布共有n+1个取值。这种分布图可以用分布律来表示,可也以用折线图来表示。;二项分布图;二项分布有两个参数:n和P,(Q=1-P);
二项分布图当P=0.5时,是对称分布。当P≠0.5时,是非对称的。n越大,非对称性越不明显。;;;二项分布在社会学研究中的统计推论意义。
书上的例子(133页):;;例子:人群中同性恋出现的概率是5%,异性恋出现的概率是95%。如果随机抽取十个人,那么这十个人中出现同性恋取向个人的概率分布为:;例子:根据生命表,年龄为60岁的人,可望活到下一年的概率为0.95。某单位有十个60岁的人,问其中有九人活到下年的概率是多少?至少有九人活到下年的概率是多少?
根据公式计算:
p(r=9)=0.315
P(9≤r ≤10)= p(r=9)+ p(r=10)=0.914;二、均值抽样分布;理解中央极限定
文档评论(0)