- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
?
?
论统计数据挖掘在经济研究与管理中的地位
?
?
杨军平 王娟
Summary:经济社会的发展离不开经济研究与管理工作,数据可以准确反映整个社会的经济运行情况,因此,经济数据必须具备真实性、可信性和时效性,能够为我国的经济发展提供信息保障。数据挖掘技术正是为了统计经济统计工作更好的开展而出现的。本文首先从统计数据挖掘与经济研究的关系及其应用与发展两个方面简要分析,接着就这一新技术在经济统计工作中的重要意义和应用范围进行了探讨,以供相关人士参考和交流。
Key:数据挖掘;经济研究与管理;统计数据
分类号:F273.4
引言:
准确的提取数据信息,提高经济工作效率是统计数据挖掘重要的研究课题,数据挖掘技术的最大优势就是能够从大量的数据中发现有用的信息并利用多种算法和分析软件对数据进行分析和处理,从而解决经济管理中的实际问题,数据挖掘和经济统计调查工作的结合对于促进经济研究与管理工作的发展具有非常重要的作用。
一、浅析统计数据挖掘在经济研究与管理中的作用
1.什么是数据挖掘?
数据挖掘(Data Mining)是采用数学的、统计的、人工智能和神经网络等领域的科学方法,如记忆推理、聚类分析、关联分析、决策树、神经网络、基因算法等技术,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。当然除了以上所列出的还有时间序列分析等一些其他的功能,数据挖掘的各项功能不是独立存在的,它们在数据挖掘中互相联系,发挥作用。
2.统计数据挖掘与经济研究和管理之间的关系
数据挖掘技术简单来说指的就是一種可以从海量信息数据中,快速、精准锁定所需有用信息数据的技术。在未进行数据挖掘之前,虽然信息数据量较为庞大,但其中有许多信息数据并不完整,甚至存在诸多错误信息数据,而通过使用数据挖掘技术,则可以将其中新颖的、有价值的信息数据准确提取出来,通过对此类精心筛选出的信息数据进行深度处理,从而为经济研究和管理工作提供真实可靠的数据支持。在经济研究与管理的过程中运用数据挖掘技术,可以帮助统计人员快速从众多未加工的经济数据中筛选出有价值的统计数据,并对其进行深入处理与再加工,为相关工作人员分析经济形势、判断经济走向、制定经济决策决议等提供重要数据参考[1]。此外,由于数据挖掘技术并不只是一种简单的数据分析工具,其可以深入结合信息使用者的实际需求,特别是在我国经济不断发展下,经济数据信息量骤增,其对于经济统计技术的要求也越来越高,将数据挖掘技术运用在经济统计当中,能够有效保障信息评估的可靠性,实现数据处理成效的进一步优化。在运用数据挖掘技术完成对经济数据的深入挖掘与分析处理下,建立起相应的数据库,可以在更好地融合各种数据信息的基础上,为经济管理活动需求提供高质量服务,有效减轻统计人员的工作负荷。
二、统计数据挖掘在经济研究与管理中的应用与发展
1.数据挖掘在经济研究与管理中的应用
数据挖掘技术在经济研究与管理中的应用可以大致的分为两个方向,分别为描述方向和预测方向。描述方向主要包括聚类和描述变量或数据间相关关系的各种算法,聚类是将相关关系较大的变量或个体聚为一类,预测方向主要包括分类和回归,分类的主要工作是“贴标签”,具体算法有决策树、人工神经网络、遗传算法、SVM、朴素贝叶斯模型等。回归不同于分类的是分类是对离散型数据做预测而回归是对连续型数据做预测,回归模型包括线性回归、多项式回归、Lasso回归、岭回归等。聚类在经济研究与管理中最为常见,为了提高调查精度,在抽样调查中可以先将调查对象聚类,再从不同类中分别抽取样本,抽样调查中的分层抽样和整群抽样都可能用到聚类方法。降维方法也广泛的应用于经济研究与管理中,由于统计调查进行一次需要花费大量的人力和物力,所以在统计调查中指标一般较多且详细复杂,这就需要数据挖掘中的降维技术将相关性大的变量合并在一起,从而使数据分析更为简便清晰,主要的降维方法有主成分法、因子分析法等。现阶段降维算法与评价算法相结合已应用于经济评价中,正是由于对数据的大量收集、数据算法的产生、经济数据库的出现、先进的计算机技术、对数据进行精深统计方法计算的能力、数据访问速度的提升等一系列东西的出现,使得数据挖掘技术的作用越来越广泛[2]。由于经济研究与管理中中数据的实用性和准确性的需要,数据挖掘技术也开始慢慢在经济研究与管理中中大展身手。
(1)统计分析法
经济数据库字段项之间存在两种关系,相关关系和函数关系。就是对于数据库中的信息利用统计学原理来进行分析。
(2)决策树
决策树一般用于预测模型,通过对大量复杂无顺序的数据有目的分类,找到有价值的信息。同时,正是因为描述简单,分类速度快,特别适合运用于经济运行过程中出现的大规模数据的处理。
(3)
文档评论(0)