- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级社会统计学复习资料
高统期末考试资料整理
1、参数:是一个变量我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,自变量因变。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。()表示,常用的置信水平有99%,95%,90%
13、变量分为哪几个层次?定类变量与定序变量之间的相关系数是什么?
变量分为四个层次,即定类变量、定序变量、定距变量和定比变量。相关系数是eat2
14、我们通常根据哪些原则确定原假设与备择假设?
推荐答案:
原假设是关于总体间参数值相等或总体分布符合某种分布的假设,是待否定的假定,与之相对立,备择假设是指总体间参数值不相等或总体分布不符合某种分布的假设,是待选择的假设
原则二:原假设往往是研究者不愿接受而期待拒绝的假设,备择假设往往是研究者希望去证实并且期待接受的假设,研究中的假设一般是备择假设,通常先设立备择假设,再对立的设定原假设
原则三:如果研究的目的只在于分析事物间是否有差异,不强调哪个比哪个好,这种情况下的假设比较容易,可以根据原则去理解和假设,这时进行的是双侧检验的情形,原假设设定为H0:U=U0等,备择假设随即设定为其对立面
原则四:如果研究的目的在于分析事物哪个比哪个好,这时可以根据原则二去理解和假设,如题目中问“是否更长,大……”,即进行右侧检验,原假设设定为:H0:U≦U0等,反之,则进行左侧检验,原假设为H0:U≧U0等。
15、何为列联表?制作列联表的原则有哪些?
1)列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。
2)制作原则:第一行是自变量的取值,第二行是因变量的取值
16、接受域:接受H0的区间,抽样所获数据计算的统计量值小于临界值,则接受H0。
17、临界值:把拒绝原假设的小概率事件定在分布的右尾,则右尾面积总和所代表的概率即为显著水平α,φ(Zα)=1-α,Zα称作临界值。(详见教材p232)
18、推断统计:主要用于抽样调查,以抽样调查获得的信息材料通过推断统计进行简化处理,以便从样本的统计值推断总体的参数值。
19、抽样分布:指统计量的分布。抽样分布是在同一总体反复不断抽取不同样本时,各个样本可能出现的样本统计值的分布情况
20、假设检验中选择统计量的一般原则是什么?
假设检验是通过样本计算某个统计量进行的,选择统计量的一般原则首先是确定是大样本还是小样本,然后根据总体方差是一直还是未知选择统计量
21、试比较相关系数与回归系数的关系
相关系数r表示的是两变量之间的疏密程度,回归系数b是回归直线的斜率,说明回归直线的陡度。
相关关系r表现了真实数据与回归直线靠拢的程度
22、总体均值检验时,哪些情况下可以使用Z检验
答:总体均值检验使用Z检验时的假定条件如下:
连个样本都是独立的随机样本
两个总体都服从正态分布
如总体不服从正态分布,可以用正态分布来近似
23、小概率原则:它是假设检验的基本思想,包括两个部分,一是指概率很小的随机事件在一次观察中不可能出现;二是如果小概率事件在一次观察中出现了,那么假设就是错误的。(小概率原理:在日常生活中,人们习惯于把概率很小的事件,当做在一次观察中不可能出现的事件。)
24、散点图:散点图是相关关系的图形表示,数据点在直角坐系平面上的分布图。散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的回归方程对数据点进行拟合。
25、回归方程:是研究自变量x不同取值时,因变量y平均值的变化。当因变量y的平均值与自变量x呈线性规律时,称做线性回归方程。
26、拒绝域:是在显著性水平(下,小概率事件发生后,拒绝原假设H0的区间。
27、简述点估计与区间估计的含义。他们之间的区别与联系有哪些
1)点估计:指用样本计算出来的一个数来估计未知参数,由于它只是一个点值所以称为参数的点估计。
2)区间估计:是通过样本计算出一个范围来对位置参数进行估计
3)区别
4)联系
28、简述置信度和置信区间的含义,并说明他们之间的关系是什么
1)含义:用Q(X1,X2,X3…..Xn)作为未知参数Q的估计值,那么包含未知参数估计值的区间就为置信区间;用置信度1-(来测量置信区间估计的可靠性
2)关系:在样本容量一定的情况下,置信区间和置信度是相互制约的,置信度越大,即估计的可靠性愈大,则相应的置信区间也愈宽,估计的愈不精确,例如,某班的考试成绩,如果估计区间为0-100分,显然这样的估计永远可靠,因为任何考试的结果,平均成绩都不会超出估计的范围
总之,置信度与置信区间的关系表达式:相互制约,置信度越大,置信区间越宽。
29、中心极限定理对社会调查的意义有哪些?
中
文档评论(0)