经济统计工作中数据挖掘技术的应用分析.docVIP

下载本文档

3
0
约6.64万字
约 6页
2017-01-13 发布于贵州
举报
版权申诉

　经济统计工作中数据挖掘技术的应用分析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

　经济统计工作中数据挖掘技术的应用分析

经济统计工作中数据挖掘技术的应用分析经济统计工作中数据挖掘技术的应用分析斗转星移，历史变迁。经济不断进步中，我国经济统计数据中一些问题凸显，如果沿用旧的的经济统计数据方式，对经济发展探索和决策极为不利。不能深层次开展统计数据的分，使得经济数据中的潜在关系，没有办法发掘。所以，在传统的统计数据中下使得处理方式不断更新，实现经济的决策促进，有着重要意义。本文主要对数据挖掘技术概念和产生进行了阐述，并且对在经济统计方面的应用展开了详细的分析。　　经济统计工作虽然一直在进行，但是其中存在着多反面的问题。在经济统计分析方面有着数字汇总简单罗列的问题，非常不利于统计部门依照统计结果做出科学的决策。这就要求新形势下的经济统计工作进行深度的数据挖掘，不断适应新的经济统计分析需要。　　一、数据挖掘技术内涵　　经济社会的发展，使得经济工作中，需要分析的经济数据增多。在对经济分析需求增大的条件下，数据挖掘技术营运而生。经济统计工作中的数据挖掘技术，是一种在不全面的、　　模糊的、随机经济数据中，分析得到潜在信息，接着对获取的数据展开分析和转换。这些数据在经过专门处理之后，应用于企业和者政府相关的决策。这种经济统计扥西方法，适应了社会中采集的数据量变大，处理信息量变大的现实。数据挖掘，实质是研究交叉的、比较复杂的学科。数据挖掘包括：知识获取、统计学、知识库系统、数据库技术、模式识别等。数据挖掘技术在发展方面经过了一个长时间的过程：：数理统计阶段、人工智能阶段、机器学习阶段。　　在社会发展过程中，经济统计数据规模越来越大，人们、企业以及政府由于对经济发展的需要，所以对其质量要求比较高。但是传统的经济分析方法存在着明显的弊端。由于传统的数据统计方法里，数据之间之间的潜在关系没有涉及分析，所以无法为企业和政府经济决策实现关键有效决策提供关键信息。因为传统的统计分析方法中，使用的是效率比较低的计算方法，无法满足社会发展中的需要，并且分析的质量也没有办法得到保证。现实中存在的问题，也没有办法得到有效解决，数据挖掘本文由论文联盟http://收集整理的方式通过信息技术的分析，可以发现数据中的潜在关系，分析出人们无法单凭感官不能实现的数据和信息之间的关系。实现了传统数据分析中的问题解决，数字挖掘技术正是为了克服上述问题而产生并发展的，利于政府和企业进行经济的决策。并且在信息技术不断发展的今天，数据挖掘技术水平也在不断提高和发展。　　二、数据挖掘技术的应用　　1、预处理　　实际工作中，数据可能在收集的过程中有缺漏，关键信息不完整。所以在进行挖掘分析之前，对数据进行有效地预处理，对于减少分析的偏差有着重要作用。总的来说，数据的预处理有四个部分。　　数据的完善　　数据的完善，主要是把数据中存在不一致、缺损和噪声清除掉，目的是提升数据在整体有效性方面的质量。通常使用的方法是——预测法、平滑法、均值法等统计法，主要根据实际情况中的差异，来抉择使用的方法。预测法，使用在推断噪声的数据和空值中，能够得到最有效的统计数据，目的是处理数据缺损。平滑法讲究将n个数据，在经过加权平均后得到的数值，作为替换数据。均值法是将n个不为空的数据，在经过数值的平均计算后的平均值，作为最终数据。平滑法和均值法也作为数据的降噪使用[1]。　　数据集合　　数据的集合就是数据集成过程。一般的数据在收集的时候，主要是由地方统计局收集通过各种途径收集，在收集之后要对这些多重多样的数据进行集成。因为这些数据挖掘的范围不同，需要通过一定的手段，使其成为一个有效地整体。在数据集合的过程中，会产生一些问题。例如，不同数据源数据中的互相匹配问题，也就是数据的模式集成问题。除此之外，不同数据之间还会产生一些差异导致的互相排斥，这些数据中的冲突需要消除。还有数据的　　冗余问题，也就是假使一部分的属性可以被其他数据库中数据属性推断的得到，数据集成中就出现了冗余的问题。　　数据的变换　　数据的变化，主要是采用一定方式，把数据变换成和其相当，并且将适合信息挖掘出来的形式。具体变换有两种，一种是规范化，一种是泛化[2]。规范化，主要构成是零均值的规范化、最大最小情况的规范。泛化，就是把数据层和层次使用较高层次概念将其替代。　　数据的概念分层　　现实中的数据有着一些明显的特点，连续性就是其一。但是在爱实际已经应用的算法中，能后对连续性数据处理的还较少数据的离散化，也就是采用区间的划分，来代替某一些实际数据，得到真实的连续数据。概念分层的意思主要是使用有效的高层概念来代替一些收集量较少的数据[3]。　　2、关联规则和决策　　关联规则　　在实际的数据挖掘领域中，整个过程采用对集合里的关联、频繁模式和因果结构开展查找，目的是找到那些不被注意