社会统计学——北京大学社会学系刘爱玉.pptVIP

社会统计学——北京大学社会学系刘爱玉.ppt

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * (二)相关分析 1、相关系数Correlation Coefficients Pearson皮尔逊相关系数 2、相关系数的检验 t检验 (三)回归分析 1、回归方程与回归系数 回归法:在知道X和Y相关的情况下,找出一种误差最小(最有代表性)的方法来预测Y的分布。 F检验的假设是: 原假设:自变量与因变量之间无线性相关,各个回归系数相等。也就是能否肯定总体回归系数中至少有一个不等于0。 研究假设:自变量与因变量之间存在线性相关,是至少有一个回归系数不等于0。 如果接受原假设,那么自变量与因变量之间的线性关系就不显著,如果拒绝原假设,接受研究假设,那么自变量与因变量之间存在线性关系。 如果计算的显著性小于,(事先确定的标准,社会科学研究中通常取0.05或0.01),则拒绝原假设,接受研究假设。 本次课程到此结束 谢谢大家 再见 * * * * * * * * * * * * * * * * * (四)离散趋势测量 异众比 极差 四分位差 方差 标准差 1、Variation ratio(异众比) 界定:异众比也称离异比率,一般用异众比来反映不同于众值的数在全体数值中所占的比例,用于测量定类变量的离散趋势。 计算公式: 异众比 =(N-众值的频次)/N 2、Range(极差) Range 也称全距或范围,即最大值与最小值之间的距离,显示的是数据分布的范围,但对于中间部分数据怎么变化,则不能推知,此外,它受极端值的影响大。 3、Interquartile Range(四分位差) 界定:也叫四分位数偏差或四分互差。 通常数据按从小到大的顺序排列后,用三个四分位数点Q1、Q2、Q3将其分成四部分。Q1是第25百分位数点或叫低四分位数点;Q2是第50百分为位数点即中位数;Q3是第75百分位数点或叫高四分位数点。四分位差规定为Q1和Q3之间的距离。 计算公式:Q= Q3 —Q1 Q越大,表示有50%的个案的分布越是远离中位值,中位值的代表性就越小,以中位值作为估计或预测的效果就越差。Q越小,说明数据比较集中在中位值附 4、Variance(方差) 方差=(观察值-均值)的平方和/n 一般方差越大,说明观察值离平均值的距离越远,数据的离散程度也越大。 5、Std.deviation(标准差) Std.deviation为Standard Deviation的简写,表示以均值做估计或预测变量时所犯错误的大小。 总体的标准偏差=根号[(观察值-均值)的平方和/n] (五)各类变量测量的概要指标 (六)集中趋势与离散程度 三、抽样调查与统计推断 (一)抽样调查的优缺点 (二)抽样技术原理 (三)统计推断原理 关于显著度 表示否定域在整个抽样分布中所占的比例,即样本的统计值落在否定域内的机会,一般社会学研究中采用的显著度是 ≤0.05 ; ≤0.01; ≤0.001.显著度选择得越小,则越难否定原来的假设,也就越难证明研究假设是对的。否定域是抽样分布内一端或两端的小区域,如果样本的统计值在这个范围内,则否定原来的假设,接受研究假设。 四、双变量描述统计 (一)列联表分析 A、定类(定序)—定序(定类) 3、两个定类变量之间相关的强度 一般用Lambda系数,它的基本的逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。消减的误差再全部误差中所占的比例越大,表示两个变量之间相关的程度越大。 对称形式: B、定序——定序变量的列联表 1、相关系数介绍 Kendall的 tau 系数 Sommers 的dy系数 Spearman’s rho 系数 Gramma系数——常用和适合 Gramma系数:统计值在-1~1 之间,最适合于分析两个定序变量之间的相关关系。Gramma属于对称相关测量法,也就是不分自变量与因变量。 Gramma系数=( Ns—Nd)/(Ns+Nd) 如果在对子中以同序对为主,则表示正相关,如果以异序对为主,则表示负相关;如果两者相当或者同分对较多,则相关程度较弱。 分母:表示在预测或估计任何一对个案的相对等级时可能犯的最大错误 分子:表示以一对个案在一个变量上的相对等级来预测它在另一个变量上的相对等级时所能够减少的误差。 因此,Gramma系数具有消减误差比例的意义。 刘爱玉 北京大学社会学系 layyby@pku.edu.cn 学习

文档评论(0)

kfcel5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档