网站大量收购独家精品文档,联系QQ:2885784924

11第14章数据分析.pptxVIP

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第11讲(第14章) 数据分析;数据整理的程序一般如下: 1. 对原始资料进行审核、订正 2. 编码 3. 数据的录入 4. 数据的清洁 5. 进行统计预处理 6. 制订数据分析的初步方案 7. 数学处理;在大量的调查工作结束后,就要对这些资料进行统计归类、整理分析,即统计分析 对调查资料进行整理统计 运用统计图进行描述性分析 进行分布分析和相对分析 集中量数分析与离中量数分析;Contents;第一节 数据分析的作用与要求;数据分析在数据收集之后进行,但应根据整个项目的目的、特点预先设计好数据分析技术,制订数据分析计划。 数据分析计划: 确定所需变量 测量这些变量所用的方法 数据分析过程及所用的技术;Contents;统计描述;频数直方图;交叉列表分析;性别和互联网使用频率;某保险公司对影响保户开车事故率的因素进行调研,并对各种因素进行了交叉表分析。 交叉表法的起点是单变量数据,然后依研究目的将这些数据分成两个或多个细目。 表1 驾驶员的事故率;然后,在性别基础上分解这个信息,判断是否在男女驾车者之间有差别。这样就出现了二维交叉表2。 表2 男女驾驶员的事故率 ;这个表的结果令男士懊恼,因为他们的事故率较女士驾车时涉及的事故率要高。但人们会提出这样的疑问而否定上述判断的正确性,即男士的事故多,是因为他们驾驶的路程较长。这样就引出第三个因素驾驶距离,于是出现了三维交叉表3。 表3 不同驾驶距离下的事故率 ;结果表明:男士驾驶者的高事故率是由于他们的驾驶距离较女士长,但并没有证明男士和女士哪个驾驶得更好或更谨慎,仅证明了驾车事故率只与驾驶距离成正比,而与驾驶者的性别无关。;二、交叉列表分析中变量的选择和确定;三、双变量交叉列表分析法;例;例;例;例;四、三变量交叉列表分析法;;提炼原来的关系;Purchase of Fashion Clothing by Marital Status;原来的关系是虚假的;Ownership of Expensive Automobiles by Education Level and Income Levels;揭示隐藏的联系;Desire to Travel Abroad by Age and Gender;原来的关系没有变化;交叉列联表分析的优缺点;;Contents;数据资料的概括技术; 1. 钟形分布; 2. J形分布; 3. U形分布; 4. 多峰分布;统计量;集中趋势指标 (Measures of Location);差异性指标 (Measures of Variability );方差 variance 标准差 standard deviation 变异系数 coefficient of variation ;形状指标 (Measures of Shape);Skewness of a Distribution;Contents;1. 总量指标和相对指标 总量指标是反映社会经济现象总体规模或水平的指标,又称为绝对数。 相对指标是两个有联系的总量指标对比计算的比率,又称为相对数。; 根据相比较的总量指标之间的关系不同,相对指标可以划分为若干种类型: (1)结构相对指标: (2)比例相对指标:;(3)强度相对指标: (4)比较相对指标: (5)动态相对指标:;2. 描述总量指标和相对指标的一些常用术语 (1)静态比较与动态比较 (2)基期与报告期 报告期又称为计算期,即被研究的时期。 作为比较基础的时期称为“基期”。 (3)时期和时点;发展水平 发展水平就是动态数列中的每一项具体指标数值。其数值可以表现为绝对数、相对数或平均数。 增长量 = 报告期水平 -基期水平 发展速度 3. 增长速度;利用excel进行数据分析;【思考题】 1.调查资料的处理包括哪些步骤? 2.调查资料的审核包括哪些内容? 3.如何对问卷中封闭式问题进行编码? 4.如何对问卷中开放式问题进行编码? 5.数据自动清理包括哪些内容? 6.对于缺失数据处理的方法有哪些? 7.数据集中趋势的指标有哪些?各有何其特色? 8. 数据离散趋势的指标有哪些?各有何其特色? 9.什么是交叉列表?如何正确的选择和确定交叉列表中的变量? 10.什么是两变量交叉列表? 11.什么是三变量交叉列表? 12.怎样对两变量交叉列表中的两变量相关关系进行判断?

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档