- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《统计和数据
第一章 统计和数据
复习要点
一、基本含义
1.统计就是用来处理数据的,它是关于数据的一门学问。
2.统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据的方法大体上可分为描述统计和推断统计两大类。
描述统计是研究数据搜集、处理和描述的统计学方法。其内容包括如何取得研究所需要的数据。如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。
推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类。
3.统计的应用。
几乎所有的领域都应用统计,但是在应用中应注意分辨被误用与滥用的现象。
二、数据类型
统计数据是对客观现象特征的反映,而由于客观现象的复杂性,在反映这些现象特征时可从不同的角度进行采集,从而得到不同类型的数据。
1.定性变量(数据)与定量变量(数据)
(1)定性变量的观察结果称为定性数据。这类数据的最大特点是它只能反映现象的属性特点,而不能说明具体量的大小和差异,只有分类特征,没有量的特征;这种只能反映现象分类特征的变量又称为分类变量,分类变量的观察结果就是分类数据。如果类别具有一定的顺序,这样的变量称为顺序变量,相应的观察结果就是顺序数据。
分类变量没有数值特征,所以不能对其数据进行数学运算。由此可见,定性数据只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。
顺序变量比分类变量向前进了一步,它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精细了一些。
(2)具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异的变量就是定量变量,也称为数值变量,定量变量的观察结果成为定量数据。
作为统计研究的主要资料,数值型数据的特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差(绝对距离),而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差(相对距离)。显然,数值型数据的计量功能要远大于前面介绍的两种定性数据,其计量精度也远远高于定性数据。因此,在统计研究中,数值型数据有着最广泛的用途。
2.观测数据和实验数据
观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。在社会经济问题研究中,观测是取得数据最主要的方法。
实验数据一般是在科学实验环境下取得的数据。在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果。自然科学研究中所用的数据多为实验数据。
三、数据的来源
从使用者的角廑看。统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据;
另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为次级数据或第二手间接的统计数据.一切间接的统计数据都是从原始的、第一手数据过渡而来的。
1.原始数据。搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。
统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向容观实际搜集资料的过程。通过统计调查得到的数据,一般称为观测数据。
实验法是通过实验法得到的数据就是实验数据。运用实验法要注意的是,首先,实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分配到实验组或对照组,而不应是经过有意识的挑选的。其次,实验组和对照组还应当是匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。
不论是统计调查还是实验,所搜集的数据都是原始数据,这是统计数据最基本的来源。
2.次级数据。次级数据(第二手数据)是指由其他人搜集和整理得到的统计数据,这种自他人调查整理基础上的数据我们把它称为数据的间接来源。
数据的间接来源常用的有以下一些:①公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。②尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构未公开发布的调查结果数据。
需要注意的是,如果公开引用未公开发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。
在应用时要注意:①是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据。②引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。
四、统计调查
统计调查是根据调查的目的与要求,运用科学的调查方法,有计划、有组织地搜集统计数据资料的过程。
1.普查是专门组织的一次
文档评论(0)