统计学--统计数据的描述.ppt

  1. 1、本文档共147页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学 第2章 统计数据的描述 第1章 回顾 知识点 统计学内涵 统计学概念及含义 要求 掌握统计学的涵义 了解统计学产生与发展 掌握统计学几个概念 第2章 统计数据的描述 2.1数据的计量尺度 2.2统计数据的来源 2.3统计数据的质量 2.4统计数据的整理 2.5分布集中趋势的测度 2.6分布离散程度的测度 2.7分布偏态与峰度的测度 2.8茎叶图与箱线图 2.9统计表与统计图 2.1 数据的计量尺度 分类方法(4种计量尺度):列名尺度、顺序尺度、间隔尺度和比例(率)尺度。 1、列名尺度(Nominal Scale) 例如:性别、民族、职业 数据表现为“类别” 各类之间无等级次序 各类别可以用数字代码表示 根据列名尺度得到的数据为分类数据。 2、顺序尺度(Ordinal Scale) 3、间隔尺度 Interval Scale 例如年份、摄氏温度 数据表现为“数值” 可以进行加减运算 “0”是只是尺度上的一个点,不代表“不存在” 根据间隔尺度得到的数据为间隔数据。 4、比例尺度 Ratio Scale 例如体重、身高 数据表现为“数值” 可以进行加减、乘除运算 “0”表示“没有”或“不存在” 根据比例尺度得到的数据为比例数据。 间隔尺度与比例尺度的区别 间隔尺度中“0”表示一个具体数值,不表示“没有”或“不存在”,比例尺度中“0”表示“没有”或“不存在” 。 间隔尺度 - 273.15℃ -123.15 ℃ 0 ℃ 26.85℃ 比例尺度 0KM 150KM 300KM 课堂练习 四种计量尺度的比较 1、四种尺度所包含的信息量是依次递增的。 2、根据较高层次的计量尺度可以获得较低层次的计量尺度。 四种计量尺度的比较:数学性质 数据和变量类型 变量的类型 变量是用来描述现象某种令人感兴趣的特征的概念。 品质变量是描述现象有关属性特征的变量,本质上不能用数字来表示。例如性别。 数量变量是描述现象有关数量特征的变量,都是用数字来表示的。例如人数,年龄等。 离散型变量指的是有限个数值或诸如0,1,2……之类无限可列值的变量。 如果某一变量可以取某一区间或多个区间中任意数值,则该变量称为连续型变量。 2.1 例子 请判断下列数据分别属于什么类型? 灯炮使用寿命 将产业划分为三类 广州市8月份各天的气温记录 将服务质量分为五个等级:好、较好、一般、差、较差。 间接取得的数据 间接取得的数据 统计部门和政府部门公布的有关资料,如各类统计年鉴 各类经济信息中心、信息咨询机构、专业调查机构等提供的数据 各类专业期刊、报纸、书籍所提供的资料 各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料 从互联网或图书馆查阅到的相关资料 提供统计数据的部分政府网站 提供统计数据的部分政府网站 直接取得的数据 普查 (census) 为特定目的专门组织的非经常性全面调查 2. 通常是一次性或周期性的 3. 一般需要规定统一的标准调查时间 4. 数据的规范化程度较高 5. 应用范围比较狭窄 抽样调查 (sampling survey) 1. 从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法 2.3数据的质量 非抽样误差:由于调查过程中各有关环节工作失误造成的。 调查方案有关规定或解释不明确导致填报错误、抄录错误、汇总错误、不完整抽样框导致的误差,调查中不回答产生的误差。 人为干扰:隐瞒、虚报。 从理论上看,这类误差可以避免。 加强培训 掌握获取完整抽样框的方法,科学抽样的方法与技术。 抽样误差:利用样本推断总体时产生的误差。 不可避免 可以计量、可以控制 数据的误差 抽样误差 (sampling error) 由于抽样的随机性所带来的误差 所有样本可能的结果与总体真值之间的平均性差异 影响抽样误差大小的因素 样本容量的大小 总体的变异性 非抽样误差 (non-sampling error) 相对于抽样误差而言 除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异 存在于所有的调查之中 有抽样框误差、回答误差、无回答误差、调查员误差、测量误差 数据来源与数据质量 1936年,罗斯福和兰登竞选总统。《文学摘要》调查了240万人,预测兰登以57%对43%获胜;Gallup(盖洛普)调查了50000人,结论是罗斯福以56%获胜。实际结果是罗斯福以62%获胜。 1952年至1988年,Gallup公司在每次调查中只抽取3439

文档评论(0)

Lancyalice + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档