统计学整理..doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学整理.

第1章 什么是统计学? 统计学是研究收集数据,整理数据,分析数据以及由数据分析得出结论的方法,简称为“数据的科学”。 统计滥用 ——不好的样本 ——过小的样本 ——误导性图表 ——局部描述 ——故意曲解 统计应用上的两个极端 ——不用或几乎不用统计 ——简单问题复杂化 随机性和规律性 当我们不能预测一件事情的结果时,这件事就和随机性联系起来了。 通过对看起来随机的现象进行统计分析,统计知识能够帮助我们把随机性归纳于可能的规律性中。统计从我们如何观察事物和事物本身如何真正发生这两个方面帮助我们理解随机性和规律性的重要性。因此,统计可以看做是一项对随机性中的规律性的研究。 规律也表现出某种随机性。 在这种意义下来说,统计就成了对数据中的偏差问题的研究。根据作为统计基础的数学理论,我们可以确定一项调查中的某一比例有多大的随机性,以及在下一次的重复调查中,这个比例可能有多大的偏差。我们还可以指出,两个比例之间的差异是否大到了随机性本身所不能解释的地步。 概率 概率是一个0到1之间的数,它告诉我们某一事件发生的机会有多大。 概率为统计学的第三个方面——如何从数据中得出结论——奠定了基石。 我们可能永远不能确定两个数字的差异是否超出了随机性本身所预期的范围,但是我们可以确定,这种差异发生的概率是大还是小。根据这个基本思想,在很多情况下,我们可以得出关于我们所处的这个世界的重要结论。 变量(variable) 是指一个可以取两个或更多个可能值的特征、特质或属性。比如,性别是取两个值的变量,因为一个人只可能是男性或女性。还有其它变量的例子,如人的寿命,体重,以及汽车每升汽油所能行驶的距离,等等。 变量的值(value) 通常是对某一特定个体的度量,特定个体可能是指一个人,一个家庭,一个地区,或一个国家。表1.1列出了一些变量、变量的取值及其所测量的个体的例子。从表中可知,性别变量是以人为个体的观测,孩子的数目是以家庭为个体的观测。 变量,值和个体 变量 变量的值 个体 性别 男,女 人 学历 小学,中学,本科,硕士,博士 人 失业 有工作,无工作 人 孩子数 0, 1, 2, 3,… 家庭 贫困程度 严重,一般,边缘,没有 地区 上面介绍的是经验变量,级处理的对像是我们周围可观测到的物质世界中的事物。 用数学方法推导的变量称为理论变量——z,t, 和F变量。 与变量相对的概念是常数。在统计中经常使用的一种被称做参数的常数。 定量变量或数值变量 可以用阿拉伯数据来记录其观察结果 如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数” 定量变量的观察结果称为定量数据或数值型数据 分类变量 表现为不同的类别 如“性别”、“企业所属的行业”、“学生所在的学院” 等 分类变量的观察结果就是分类数据 顺序变量或有序分类变量 具有一定顺序的类别变量 如考试成绩按等级,一个人对事物的态度 顺序变量的观察结果就是顺序数据或有序分类数据 分类变量和顺序变量统称为定性变量 数据的收集 数据收集的第一个准则是要清楚测量的是什么。换句话说,变量必须有一个明确的适合研究目的的定义。 观测数据 数据收集有两种主要方法,其中一种是当我们观测现实世界时收集到的数据,如在不同城市中的流动人口数量。观测数据是指仅通过对世界的观察(而没有操纵或控制它)所得到的数据。收集观测数据的研究者们尽量不干涉研究对象的行为模式。 数据的来源——观测研究 抽样调查(sample survey) 普查(census) 抽样的精髓:从检查一部分来得知全体。 抽样调查是一种很重要的观测研究,选中这些人是因为他们具有代表性局限性:time and cost 总体和样本 收集数据是为了从收集的个体中得出结论。 所有我们感兴趣的个体就组成了总体。比如,你读本教材这一时刻,我国所有居民就构成了一个总体。 有时我们能够收集到总体中所有个体的数据。在这种情况下,我们就是对总体做了普查(census)。我国进行的第六次全国人口普查就是希望确定我国所有居民数。 然而,在苛刻的现实生活中,由于资金、时间有限以及不断变化的环境条件,普查通常是很困的。此时,我们需要把收集数据限制在总体的一个样本上,样本是总体的中的一个被选中的部分。 样本的选择 我们希望基于样本得出的结论能够适用于该样本所属的总体,这依赖于获得一个好的样本,否则这是不可能实现的。 由于样本选择对于结果的可信度有重要作用,所以根据正确的统计原理选择样本是非常必要的。 概率抽样 根据一个已知的概率来抽取样本单位,也称随机抽样 特点 按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中 每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要

文档评论(0)

wuyuetian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档