- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
烟台南山学院商学院 第11章 数据分析 【教学目标】 了解单变量描述分析的基本思想和分类 掌握集中趋势的概括技术和展示方法 掌握离散趋势的概括技术和展示方法 理解相关分析原理与方法 理解聚类分析、判别分析、因子分析的原理与统计分析要点 开篇案例:中国互联网络发展状况分析报告 从2005年6月中国互联网络发展状况统计调查所展现的数据可以看出,2005年上半年的中国互联网络在整体上保持增长态势的同时,网民特征结构、上网途径、上网行为等各方面也出现了一些较为明显的变化。 在网上查找CNNIC最近一次互联网络发展状况的完整分析报告,概括说明报告中所使用的主要分析方法以及图表工具。 11.1 数据分析概述 描述性分析是将原始数据转换成一种易于理解和解释的形式。它主要通过有关统计量(关于样本或总体的)来描述数据特征、找出数据的基本规律。 有关统计量(样本/总体)是用来描述数据特征的概括性数字度量,它是根据样本/总体数据计算出来的一些量,是样本/总体的函数。 描述性分析主要包括: 单变量数据的分析 双变量和多变量数据的分析 数据的深度分析 11.2 单变量数据的分析 描绘样本数据,就是以一种简明且有意义的方式对结果进行研究和解释。 单变量数据分析的方法: 对数据进行重新排列; 对数据进行分类或分组; 数据概括; 数据分布状态分析。 数据分类/分组与频数分布 频数分布是单一统计变量的各个类别或每个值出现的次数和频率的一种分布状态。频数分布始于数据的分类/分组,重点是变量的各类别或每个值出现次数的统计,最终通过适当的图表工具展示该变量的频数分布。 频数分布统计,关键是要区分变量及数据类型: 对类别和顺序变量的数据主要是作分类统计, 对等距与等比变量的数值型数据则主要是作分组统计。 类别或顺序数据的频数分布 类别或顺序数据的频数分布 数值型数据分组与频数分布 频数趋势分析 数据集中趋势的概括 集中趋势是指数据分布趋向集中于一个分布的中心。集中趋势概括是指用一个数值来代表变量值的分布情况,根据这个数值可以估计每一个研究个案该变量的值。 概括数据分布集中趋势的统计量包括 众数 中位数 平均数 不同类型的数据适用不同的集中趋势度量,低层次数据的集中趋势度量同样适用于高层次数据,但是,高层次的概括却不适用于低层次数据。 集中趋势的概括-众数 集中趋势的概括-中位数 中位数(median)是一组数据按数值大小排序后,位置居于最中间的那个值。各变量值与中位数的离差绝对值之和最小。 中位数既适用于定量数据,也适用于顺序数据,而且中位数是描述顺序数据集中趋势的最好度量。 确定中位数应区分两种情况: 根据原始数据计算中位数 根据分组数据计算中位数 分组数据的中位数度量 四分位数度量 集中趋势的概括-平均数 平均数或均值(mean)是统计分析中最常用的集中趋势统计量。在SRS抽样中,均值就是算术平均值。对于复杂的抽样设计,样本均值的计算需要考虑最终样本权数。 平均数度量有许多优点: 易于计算与理解,且可用于计算其它统计量(如样本方差) 。 对于许多抽样设计来说,样本均值是总体均值的无偏估计。 样本均值度量也有不足之处: 均值不能用于概括类别或顺序数据的集中趋势。 均值会向极端值的方向靠近,受极端值影响很大。 平均数度量 根据原始数据计算平均数 在简单随机抽样中,样本均值就是变量的原始数据之和除以数值个数。设某变量的一组数据为:x1,x2 ,… ,xn ,则 根据分组数据计算平均数 设某变量的一组数据为:x1,x2 ,… ,xn 各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为:f1 , f2 ,… ,fk 则分组数据平均数实际上是一种加权平均数: 众数、中位数和平均数的比较 数据离散趋势的概括 离散趋势是指数据分布偏离其分布中心的程度。离散趋势测量是指求出一个数值,以表示变量值分布的离散程度以及变量值之间的差异程度。 离散趋势测量与集中趋势测量之间,实际上是一种相互补充和相互说明的关系。 集中趋势测量求出的是一个最有代表性的值,这个值代表性高低取决于个案之间在变量取值上的差异程度(离散度)。差异越大,则说明集中趋势的统计量的代表性越差;反之,代表性就越好。同时进行集中和离散趋势测量,利于更全面、准确地认识事物的特征。 数据离散趋势的测量 数据的离散趋势分析所使用的统计量包括: 离异比率 四分位差 标准差与标准差系数 离散趋势测量例题 [例11.2] 某地区行业组织抽查5家企业月销售额和销售利润数据(单位:万元),如表11-7第2行所示。试根据上述数据比较销售额和销售利润的离散程度。 根据5家企业的月销售额数据和月销售利润数据分别计算其平均数、标准差以及标准差系数,分别列于表11-7的第3-5行。 离异比率、四分位差与标准差
您可能关注的文档
最近下载
- 【0196】82页PPT农业集团企业信息化总体解决方案(豪华版).pptx VIP
- 2025至2030自动焊接机器人系统行业调研及市场前景预测评估报告.docx
- 北师大版(北京)八年级全册物理第七章 热现象单元练习题.doc VIP
- SMTC 5 320 040 与空气接触橡胶材料要求(20130531).pdf VIP
- 酒厂(白酒生产企业)安全生产标准化管理体系全套资料汇编(2019-2020新标准实施模板).doc VIP
- 2024-2025学年八年级物理上册第一章《声现象》单元测试卷(苏科版2024新教材)(含解析).pdf VIP
- 2019年上海科技大学991数据结构与算法硕士研究生考试真题.pdf VIP
- 职业中等学校音乐表演人才培养方案.docx VIP
- 英语 第一册(五年制高职)课件全套 Unit1 A New School---Unit8 Time to Celebrate.pptx
- 四年级数学-课前三分钟讲稿-三角形和四边形-图形稳定性的应用--精品课件.ppt VIP
文档评论(0)