- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、变量的测量层次
二、单
社会统计复习整理-变量
测量层次
变量举例
数学特性
单变量分析
定类[nominal]
区分类别
性别 职业 婚姻状况 宗教信仰
=工
⑴频数分布、频率分布 ⑵众数、异众比率
定序[ordinal] 区分类别后,还 能排列高低、大 小、先后、强弱 等等级序列
文化程度 城市规模 社会地位 生活水平 住房条件 工作能力
⑴频数分布、频率分布 ⑵众数、异众比率
⑶中位数、四分位差
定距[interval] 区分类别、等级 后还能算出等级 间的差距数量, 但没有实际意义 的“0”
年龄 时间 出生率 性别比
+—
⑴频数分布、频率分布 ⑵众数.异众比率 ⑶中位数、四分位差 ⑷平均数、标准差、离散系 数
定比[ratio] 区分类别、等级 后还能算出等级 间的差距数量, 但具有实际意义 的“0”
收入 年龄 时间 出生率 性别比
X*
⑴频数分布、频率分布 ⑵众数、异众比率
⑶中位数、四分位差 ⑷平均数、标准差、离散系 数
⑵G系数.Z检 验:定序与定序
数、V系数.C 系数、丸系 数:定类与定 类;定类与定序
兀检验.0系
⑷r//系数.
F/t检验、回归 方程:定距与定 距
⑶E/上厂系数?
F检验:定类与 定距;定序与定 距
双变量分析 ⑴交互分类表.
变量描述
例:甲、乙两同学分别在各自的班里考了 80分,两班同学都为 N=100,其中,甲:eft (cf为该数下限的向上累加次数)=95 乙:cft =60请问:甲、乙两位同学哪个考得更好?
解:因为两个班中N均为100,因此只需要对比其向上累加 次数即可。甲的向上累加次数为95,表示小于他成绩的同学有95 位,即甲为第5名,同理,小于乙同学成绩的班级同学有60位, 即乙为第40名,因此甲考得好一些。
同理,如果给出的例题用向下累加次数算,即算倒数的排
根据分组资料求中位数(众数用表示,中位数Md) 例如:调査某地区的212个乡,
目的是要知道每个乡之育龄妇女(15-44岁)
落实计划生育的比率,以下为收集到的资料。
节育率(%)
频次
向上累加频次
5及以下
16
16
5-15
38
54
15-25
40
94
25-35
30
124
35 45
23
147
45-55
24
171
55 65
19
190
65及以上
22
212
汇总
212
解:
中位数所在位置为212/2=106,根据向上累加频次106 (介于94与124之间)位于25-35这一组
其中L为中位数所在组的真实下限,f为中位数所在组的频次,cf为低于中位数所在组下限的累加频次,n为全部个案 的数目,w为中位数所在组的组距。则L=25 ^=35-25=10 U30 c匸94
用比例插值法假定中位数所在的组每个数均匀分布,计算如下:
首先用Md- cf 1=106-94=12,即中位数处于本组中的第12个数,算岀该数在本组的比例,即12/30=40%
用组距乘以比例加上貞?实下限即可算岀中位数的估计位置处在本组中的值Md=40%*10+25=29
异众比率V=(n-fmo)/n表示一组数据中非众数的次数与全部个案数目的比率,V=0说明变量只有一个取值,就是众 数,这时候众数可完全代表变量,V=1时,表示资料十分分散,众数几乎无代表性。
极差R (全距)=观察的最大值-观察的最小值
极差小表示资料比较集中,极差大表示资料分散,即:极差越大用集中量数的代表性越小。极差受极端值的影响会非常 大。运动员在比赛中计算成绩时,经常会去掉评委给的最高分,最低分,目的就是为了缩小极差,去掉最髙和最低分后 计算出的集中量数(常是均值)就能比之前较好地代表运动员的真实水平。
四分位差Q:把一组数据按从小到大的顺序排列,其3/4位置的值与1/4位置的值的差异。Q=Q3-Q1,四分位差越大, 说明有50%的个案的分布越远离中位数,因而中位数的代表性就越小;反之,越小就说明越集中,代表性就越大。
Q1 的位置(n+l)/4 Q3 的位置(n+l)*3/4
例:试讣算以下数值的四分位差、中位数、众数
2, 2, 3, 4, 4, 4, 5, 5, 6, 6, 7
解:Q1的位宜是(n+l)/4=3,即第三个数3, Q3则为第九个数6,四分位差Q=6-3=3
中位数是第六个为Md=4众数Mo=4
标准差(符号。或S):也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,是用得 最多、也是最重要的离散趋势统计量。(表示用均值作估计或预测变项时所犯错误的大小)
具体汁算中,如是总体,标准差公式根号内除以n,如是样本,标准差公式根号内除以自由度(n-1),它是意思是样本 能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n-1。
文档评论(0)