- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
人人好公,则天下太平;人人营私,则天下大乱。——刘鹗
具有数量特征的数据和材料
统计学是研究数据的收集、整理、分析的一门科学,工作流程可
以分为:设计、搜集、整理、分析、展示、解释数据。
数据是统计活动过程中所获得的反映社会现象的数字资料及与
之相联系的其他资料的总称。统计学研究客观事物离不开数据,数据
是客观现象进行计量的结果,所以数据的类型、质量在统计分析中很
重要,甚至还能影响结果。数据的类型、分布与特征反映了对象的基
本状况,也决定了要使用的分析方法。数据要应用、有意义,还要结
合具体的业务场景,才能有标准、能判断。
在做数据分析之前,先清楚我们研究的对象属于哪类范畴,然后
在按着这个分支检索自己该用到的知识或方法来解决问题。统计学的
目的是对于数据(特别是未知的数据)进行描述、假设推断、预测和
分析,其实描述更像是统计为得出最终结论的一个手段,分析的过程
就是通过描述,从数据中获取有用的信息,比如规律或异常即上一篇
的同质性或差异,加以利用并创造价值。
(一)数据的分类
统计数据是采用某种计量尺度对事物进行测度的结果采用不同
的计量尺度会得到不同类型的统计数据,数据包括:各种数字、文字、
图像、音频、视频及它们的组合等多种格式。根据数据的内容大概可
以分为以下2类:
人人好公,则天下太平;人人营私,则天下大乱。——刘鹗
(1)分类数据,又称为定性数据。它用于确定数据的属性,是
不支持算术运算的数据,用于说明事物的品质特征,结果表现为类别,
可能是文字也可能是数字,可以分为两类:
①无序数据。比如:人的性别可以分为:男,女,未知三类,也
可以把它们记为0,1,2;学生的成绩可以分为:及格,不及格,按
自己的需求、惯例等,也可以用0,1或者a,b来标识等等。
②顺序数据,这其实也是分类数据的一种,但是分类数据不要求
有顺序,它是有序的。比如空气污染可以分为:优,良,轻度污染,
中度污染,重度污染,其中后面一级都比前面一级的程度更严重,也
可以用1,2,3,4,5来标识这几种分类;学生的成绩也可以分为:
优秀,良好,及格,不及格,后面一级的数据也都比前面的更差。
(2)数值型数据,又称为定量数据,用于说明现象的数量特征,
形式是数字,也可以分为两类,主要按数值表现是否连续:
①离散型数据,离散型是通过计数方式得到的,增长量不固定,
比如:一个企业1月份招聘了10人,2月份招聘了50人;北京市去
年净流出200万人,今年净流出100万人;
②连续型数据,这是一直叠加上去的,增长量可以划分为固定的
单位。如:人的年龄是1岁,1.2岁,1.5岁,2岁人的身高
1.5米,1.51,1.52
定性与定量数据的关系:定性数据与定量数据相互补充,定性是
定量的前提和依据,定量使定性更加具体、准确,结合使用才能通过
比较来分析和说明问题。
人人好公,则天下太平;人人营私,则天下大乱。——刘鹗
区分测量的层次和数据的类型很重要,因为不同类型的数据采用
处理和分析的统计方法也不同。比如,对无序数据,通常计算出各组
的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验
等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数
等非参数分析;对离散数据还可以用更多的统计方法进行处理,如计
算各种统计量、进行参数估计和检验等。我们所处理的大多为
文档评论(0)