沈浩课堂笔记答案.docVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《调查统计中的统计分析方法》考点整理 绪言 Pascal 和Fermat 提出了“概率”这一概念,用来描述某一事件发生的可能性。 Pearson提出了“频度分布”、“频度分布函数”、“回归”、“相关”“拟合度”等概念。 Gorsset苦心钻研统计理论,终于想出了一种小样本的检验方法——T检验,由此诞生了小样本检验理论。他的伟大功绩在于从统计的意义上明确了推断、检验的含义及其与数学的关系,创立了估计理论和检验理论等统计的理论体系,开拓了统计学的新领域,也就是创立了与过去的描述性统计学所不同的推断性统计学。 所谓社会调查,曾被认为是要对全部对象(总体)进行全面调查,从而为将来制定计划和决策准备基础资料。但是,全面调查从时间和经济上都是十分困难的,可以进行部分调查及抽样调查,这样在从时间上和经济上都是合算的。根据抽样调查的结果,可以对总体的状况进行估计和推断。实际上各国在经济统计、国势调查、社会调查、收视率调查、民意测验上等,采用的几乎都是抽样统计。 现代统计学有以下几个特点:(1)随着实际应用的需要,对数理统计理论和方法提出了越来越高的要求,从线性到非线性、从低维到高维、从显在到潜在、从连续到离散等;(2)计算机及其相应的统计软件已经成为统计工作者不可缺少的工具,如SPSS、SAS、DATA-TEST、STATA等(3)现代统计学正逐步成为一门通用的研究、如何合理的有效的获取、整理和分析数据的交叉性学科。 第一部分 基础统计学 统计学的性质 统计学是一门方法论的学科,是如何从不确定性中做出明智决定的一门(使人聪明的)技术。统计学是关于通过取自某总体的样本来描述和推断该总体的方法,为了避免偏差,样本必须是随机抽取的。于是必须构造一个置信区间,它包括一个表示抽样不确定性的误差范围。 2、在大样本中,用样本比例P来估计总体比例π就可靠得多。 对于简单随机抽样,置信度为95%的置信区间是 π=P±1.96 其中π和P分别表示总体和样本的比例,n为样本量(大样本公式)。 对于π的估计并不是确确实实给出的,只有95%正确,有5%的可能性会抽到一个很偏的样本;但随着样本量的增大,误差范围缩小了。总之,通过随机抽样,我们可以对未知的总体做一个“无偏的”估计,这是一个包含有不确定性的置信空间。 3、双盲试验,随机的将试验对象分为两个组,即试验组和对照组,但试验者和试验对象都不知道分组情况。 确定一个处理是否有效的试验中,怎样避免误差?必须采用随机抽样的方法来决定让谁来接受处理以及让谁留下作为对照着。而且对于任何有可能对结果产生偏见的人,都应该避免使他了解是谁接受了处理而谁没有。 第二章 描述性统计 描述性统计是对调查样本中所包含的大量数据资料进行整理、概括和计算,它是推断性统计的基础。 测量可以分为四个等级:名称级、顺序级、间隔级和比例级。名称级用于测量“定类变量”的“值”,这是最低级别的测量等级;顺序级用于测量“定序变量”的值;间隔级用于测量“定距变量”的值;比例级用于测量“定比率变量”,这是最高的测量级别。如果测量的零点有确定的实际意义,那么测量就达到了比例级。 以上四类中,名称级的级别最低,比例级的最高。不同级别的变量在进行统计分析时要注意使用相应的统计方法。一般情况下,测量级别高的变量可以当作测量级别低的变量来分析,但反过来一般是不可以的。不过在社会科学的研究中,由于定序变量可以赋予一定的得分值,习惯上也常常把它当作定距变量来处理。因此定类变量是属于定性型的(或非数值型的);定距和定比变量是属于定量型的(或数值型的),而定序变量则根据具体情况,既可以看成定性型的也可以看成是定量型的。 统计量是一个不包含任何未知参数的样本函数。 频数表和直方图是最常用的定量而直观的整理和描述数据的手段之一,它们在表示相对频率上是很有用的。 众数(mode)表示流行、时兴之意,有众多的意思。因此一个分布的众数就定义为出现次数最多的变量值。它特别适用于定类和定序变量。 中位数(median)就是第50百分位数点上的值。将样本的n个观测值重新由小到大排序,中间位置上的那个值就叫中位数。由于中位数的定义依赖于数据的大小顺序,因此它不适合于定类变量。对于定序和定距变量,特别是对于分布很不规则的情况,中位数是比较理想的统计量之一。 均值、中位数和众数的比较:如果x的分布是单峰的对称分布时三者是一致的;对于一个偏斜的分布,相对于众数,中位数朝长尾巴方向偏离了一些,而均值则偏离得更远。当分布比较有规则即不存在极端值时,用均值代表分布的中心比较好;而在有极端值时,则用中位数更合适。众数虽然稳定性最差,但在有些情况下却十分方便。 均值 中位数 众数 适用于定距或定比变量 主要适用于定序变量 主要适用于定类变量 最稳定 较均值的稳定性差 最不稳定 计算时要用

文档评论(0)

1112111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档