- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章统计和统计数据推荐
* :1, 1, 3 * 5 * * As a result of this class, you will be able to ... * As a result of this class, you will be able to ... * As a result of this class, you will be able to ... * :1, 1, 3 * * * * * :1, 1, 3 * :1, 1, 3 * * :1, 1, 3 * * * * * * * * * * * * * * * * * 统计的误用与滥用 统计应用上的两个极端 不用或几乎不用统计 简单问题复杂化 在统计应用中,这两个极端都是不可取的 简单的方法不一定没用,复杂的方法也不一定有用。正如有的学者所说的,最简单的模型往往是最有用的 统计应该恰当地应用到它能起作用的地方。不能把统计神秘化,更不能歪曲统计,把统计作为掩盖实事的陷阱 1.2 怎样获得统计数据 1.2.1 变量与数据 1.2.2 数据的来源 第 1 章 统计和统计数据 1.2.1 变量与数据 1.2 怎样获得统计数据 * 变量与数据 变量(variable) 从一次观察到下一次观察会出现不同结果的某种特征 观察一个企业的销售额,这个月和上个月有所不同;观察股票市场上涨股票的家数,今天与昨天数量不一样;观察一个班学生的生活费支出,一个人和另一个人不一样;投掷一枚骰子观察其出现的点数,这次投掷的结果和下一次也不一样 “企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”等就是变量 数据(data) 观察到的变量的结果 * 变量与数据 定量变量(quantitative variable)或数值变量(metric variable) 可以用阿拉伯数据来记录其观察结果 如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数” 定量变量的观察结果称为定量数据或数值型数据(metric data) 分类变量(categorical variable) 表现为不同的类别 如“性别”、“企业所属的行业”、“学生所在的学院” 等 分类变量的观察结果就是分类数据(categorical data) 顺序变量(rank variable)或有序分类变量 具有一定顺序的类别变量 如考试成绩按等级,一个人对事物的态度 顺序变量的观察结果就是顺序数据或有序分类数据(rank data) 分类变量和顺序变量统称为定性变量(qualitative variable) 1.2.2 数据的来源 1.2 怎样获得统计数据 * 数据的来源 寻找二手数据 抽取样本 总体(population):包含所研究的全部个体(数据)的集合 样本(sample):从总体中抽取的一部分元素的集合 样本量(sample size):构成样本的元素的数目 概率抽样方法 * 抽样方法 * 概率抽样(probability sampling) 根据一个已知的概率来抽取样本单位,也称随机抽样 特点 按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中 每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率 * 简单随机抽样(simple random sampling) 从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样 特点 简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 局限性 当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率 * 简单随机样本(simple random sample) 由简单随机抽样形成的样本 从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n样本都有相同的机会(概率)被抽中 参数估计和假设检验所依据的主要是简单随机样本 * 分层抽样(stratified sampling) 将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本 优点 保证样本的结构与总体的结构比较相近,从而提高估计的精度 组织实施调查方便 既可以对总体参数进行估计,也可以对各层的目标量进行估计 * 系统抽样(systematic sampling) 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依
文档评论(0)