- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE
PAGE1
中级经济师《经济基础知识》第四部分“统计”的知识点
一、第二十三章“统计与数据科学”的知识点
第二十三章的知识点1:统计学的两大分支
统计学的两大分支
描述统计
描述统计是研究数据收集、整理和描述的统计方法。
(收集、整理、描述、取得、展示。)
描述统计的内容包括:如何取得所需要的数据、如何用图表或数学方法对数据进行整理和展示、如何描述数据的一般性特征。
推断统计
研究如何利用样本数据推断总体特征的统计方法。其内容包括:
(1)参数估计:利用样本信息推断总体特征;
(2)假设检验:利用样本信息判断对总体假设是否成立。
第二十三章的知识点2:统计变量和数据
1、统计变量和统计数据
统计变量和统计数据
统计变量
统计数据
定量变量(数量变量)
变量的取值是数量
如:企业销售额1000万元
定性变量
(类别)
分类变量
变量的取值是类别,没有顺序
如:用0表示男性,1表示女性
顺序变量
变量的取值是类别,且有顺序
如:用1表示硕士及以上,2表示本科
2、数据的来源分类
(1)数据的来源按其收集方法,可以分为观测数据和实验数据。
①观测数据:通过直接调查或测量而收集到的数据,称为观测数据。观测数据是在没有对事务施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据。例如:GDP(国内生产总值)、CPI(居民消费价格指数)、房价、税收收入、三次产业增加值、棉花产量、新建商品住宅销售价格等。
②实验数据:通过在试验中控制实验对象以及其所处的实验环境收集到的数据,成为实验数据。比如:一种新产品使用寿命的数据、一种新药疗效的数据。
(2)数据的来源从使用者的角度看,数据的来源主要分为:一手数据、二手数据。
①第一手数据(直接数据)是指通过直接的调查、实验或观察等方式获取的原始数据。一手数据的来源主要有实验、调查或观察。例如:通过临床试验获得的新药疗效数据、通过入户调查得到的家庭月收入数据、通过网络小差得到的网民对某项政策的支持数据。
②第二手数据(间接数据)则是指通过已有文献、报告或其他数据源获取的数据,这些数据并非为当前研究目的而专门收集的。二手数据包括科研论文、公开出版物、统计年鉴、未公开的内部调查等。
第二十三章的知识点3:统计调查的概念和分类
统计调查的概念和分类
分类依据
具体类别
主要内容及举例
按调查对象的范围不同
全面调查
对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查,如:人口普查、经济普查等。
非全面调查
对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查等。如:城市居民家庭的生活水平等。
按调查登记的时间是否连续
连续调查
为了观察总体现象在一定时期内的数量变化。连续调查资料说明现象的发展过程,目的是了解社会现象在一段时间的总量。如:产品产量、能源的消耗等。
不连续调查
间隔一个相当长的时间所做的调查,一般是为了对总体现象在一定时点上的状态进行研究。如:生产设备拥有量、耕地面积等。
第二十三章的知识点4:普查和抽样调查
普查和抽样调查
普查和抽样调查
含义
特征或目的
普查
普查是为某一特定目的而专门组织的一次性全面调查,主要用于了解处于某一时点状态上的社会经济现象的基本全貌。
(1)通常是一次性的或者周期性的
(2)一般需要规定统一的标准调查时间
(3)数据一般比较准确
(4)使用范围比较窄
抽样调查
抽样调查是根据样本调查结果来推断总体特征的一种非全面调查。
(1)经济性(显著优点)
(2)时效性强
(3)适应面广
(4)准确性高
第二十三章的知识点5:大数据与数据挖掘
1、大数据的特性
大数据具有“4V”特性:数据量大、数据多样性、价值密度低、数据的产生和处理速度快。
2、数据挖掘的含义
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中,但又有潜在价值的信息和知识的过程。
数据挖掘包含以下几层含义:
(1)数据源必须是真实的、大量的、有噪声的。
(2)发现的是用户感兴趣的知识。
(3)发现的知识是可接受、可理解、可运用的。
(4)不要求发现放之四海而皆准的知识,仅支持特定的发现问题。数据挖掘以解决实际问题为出发点,核心任务是对数据关系和特征进行探索。
3、常见的数据挖掘方法
(1)常见的数据挖掘方法可分为:监督学习、无监督学习和半监督学习。
(2)监督学习有两大类学习任务:分类和回归。
①分类:分类是将数据点分配到预定义的类别之一。例如:垃圾邮件过滤(将电子邮件分类为垃圾邮件或非垃圾邮件)、图像识别(将图像分类为不同的对象类别)和情感分析(将文本分类为正面、负面或中性)。
②回归:回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。回归即预测
文档评论(0)