网站大量收购独家精品文档,联系QQ:2885784924

社会统计复习资料.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、变量的测量层次 二、单 社会统计复习整理-变量 测量层次 变量举例 数学特性 单变量分析 定类[nominal] 区分类别 性别 职业 婚姻状况 宗教信仰 =工 ⑴频数分布、频率分布 ⑵众数、异众比率 定序[ordinal] 区分类别后,还 能排列高低、大 小、先后、强弱 等等级序列 文化程度 城市规模 社会地位 生活水平 住房条件 工作能力 ⑴频数分布、频率分布 ⑵众数、异众比率 ⑶中位数、四分位差 定距[interval] 区分类别、等级 后还能算出等级 间的差距数量, 但没有实际意义 的“0” 年龄 时间 出生率 性别比 +— ⑴频数分布、频率分布 ⑵众数.异众比率 ⑶中位数、四分位差 ⑷平均数、标准差、离散系 数 定比[ratio] 区分类别、等级 后还能算出等级 间的差距数量, 但具有实际意义 的“0” 收入 年龄 时间 出生率 性别比 X* ⑴频数分布、频率分布 ⑵众数、异众比率 ⑶中位数、四分位差 ⑷平均数、标准差、离散系 数 ⑵G系数.Z检 验:定序与定序 数、V系数.C 系数、丸系 数:定类与定 类;定类与定序 兀检验.0系 ⑷r//系数. F/t检验、回归 方程:定距与定 距 ⑶E/上厂系数? F检验:定类与 定距;定序与定 距 双变量分析 ⑴交互分类表. 变量描述 例:甲、乙两同学分别在各自的班里考了 80分,两班同学都为 N=100,其中,甲:eft (cf为该数下限的向上累加次数)=95 乙:cft =60请问:甲、乙两位同学哪个考得更好? 解:因为两个班中N均为100,因此只需要对比其向上累加 次数即可。甲的向上累加次数为95,表示小于他成绩的同学有95 位,即甲为第5名,同理,小于乙同学成绩的班级同学有60位, 即乙为第40名,因此甲考得好一些。 同理,如果给出的例题用向下累加次数算,即算倒数的排 根据分组资料求中位数(众数用表示,中位数Md) 例如:调査某地区的212个乡, 目的是要知道每个乡之育龄妇女(15-44岁) 落实计划生育的比率,以下为收集到的资料。 节育率(%) 频次 向上累加频次 5及以下 16 16 5-15 38 54 15-25 40 94 25-35 30 124 35 45 23 147 45-55 24 171 55 65 19 190 65及以上 22 212 汇总 212 解: 中位数所在位置为212/2=106,根据向上累加频次106 (介于94与124之间)位于25-35这一组 其中L为中位数所在组的真实下限,f为中位数所在组的频次,cf为低于中位数所在组下限的累加频次,n为全部个案 的数目,w为中位数所在组的组距。则L=25 ^=35-25=10 U30 c匸94 用比例插值法假定中位数所在的组每个数均匀分布,计算如下: 首先用Md- cf 1=106-94=12,即中位数处于本组中的第12个数,算岀该数在本组的比例,即12/30=40% 用组距乘以比例加上貞?实下限即可算岀中位数的估计位置处在本组中的值Md=40%*10+25=29 异众比率V=(n-fmo)/n表示一组数据中非众数的次数与全部个案数目的比率,V=0说明变量只有一个取值,就是众 数,这时候众数可完全代表变量,V=1时,表示资料十分分散,众数几乎无代表性。 极差R (全距)=观察的最大值-观察的最小值 极差小表示资料比较集中,极差大表示资料分散,即:极差越大用集中量数的代表性越小。极差受极端值的影响会非常 大。运动员在比赛中计算成绩时,经常会去掉评委给的最高分,最低分,目的就是为了缩小极差,去掉最髙和最低分后 计算出的集中量数(常是均值)就能比之前较好地代表运动员的真实水平。 四分位差Q:把一组数据按从小到大的顺序排列,其3/4位置的值与1/4位置的值的差异。Q=Q3-Q1,四分位差越大, 说明有50%的个案的分布越远离中位数,因而中位数的代表性就越小;反之,越小就说明越集中,代表性就越大。 Q1 的位置(n+l)/4 Q3 的位置(n+l)*3/4 例:试讣算以下数值的四分位差、中位数、众数 2, 2, 3, 4, 4, 4, 5, 5, 6, 6, 7 解:Q1的位宜是(n+l)/4=3,即第三个数3, Q3则为第九个数6,四分位差Q=6-3=3 中位数是第六个为Md=4众数Mo=4 标准差(符号。或S):也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,是用得 最多、也是最重要的离散趋势统计量。(表示用均值作估计或预测变项时所犯错误的大小) 具体汁算中,如是总体,标准差公式根号内除以n,如是样本,标准差公式根号内除以自由度(n-1),它是意思是样本 能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n-1。

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档