数据挖掘技术在经济统计中的应用探究.docVIP

数据挖掘技术在经济统计中的应用探究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在经济统计中的应用探究.doc

数据挖掘技术在经济统计中的应用探究   摘要:随着经济的发展,经济统计数据的逐渐加大,数据质量问题进一步影响着经济探究、总结与决策。传统的数据处理方式越来越不能满足现实需要,给经济工作带来一定困难,正是由于这一系列问题的出现,而逐步产生了对数据的挖掘。本文就数据挖掘技术怎样、如何在经济统计中进行应用进行了相关介绍,为经济统计工作作出了一定的贡献。   关键词:数据挖掘;经济统计;技术;应用   中图分类号:C811 文献标识码:A 文章编号:1001-828X(2013)06-0-01   一、数据挖掘技术的基本概念与产生过程   随着信息技术的发展,采集的数据量的急剧加大,此时产生了数据挖掘,它就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在对大量的数据进行抽取、转换、分析和其他模型化处理过程中,从而提取得到对一些决策数据的支撑。   数据挖掘是一个由数理统计到人工智能,进而到机器学习的逐步演变、变化过程。它是一门交叉的学科,是一门涉及广泛的学科,是一门在社会的发展历程中不断前进变化的学科。它所涉及到的内容包括数据库技术、人机智能、知识库系统、知识获取、神经网络、统计学、模式识别、信息检索等,并且在跟着发展的需要、学科的进步变化而不断发展、向前。   由于数据量之大,传统的统计分析方法主要是对没有明确假设的前提下去挖掘信息,只会使得效率低下,同时,对于问题的解决也在大打折扣,处理的结果不理想,传统的这种方法没有找到数据之间的内在联系,这样只是看到过去,不能很好的预测未来,对所要探索的目标不能得出想要的结论;而数据挖掘是将所得到的信息是对前者的补充,得到未知的潜在的东西,是在原有的基础上发现那些没法预料的、不是靠感官所能察觉的,甚至是一些与生活所违背的,它更是人工智能和统计分析的结合,是对传统技术的进一步拓展,由于对数据分析要求的进一步提高,也正是这一些特征才使得数据挖掘的结果而更加有意义与价值。   二、数据挖掘的相关技术与在经济统计中的应用   正是由于对于数据的大量收集、先进的计算机技术、数据算法的产生、超大规模数据库的出现、数据访问速度的提升、对数据进行精深统计方法计算的能力等等一系列东西的出现,从而一步步使得数据挖掘技术的作用越来越广泛。对于经济统计准确性与实用性的需要,数据挖掘技术才开始慢慢渗透到经济统计工作中。数据挖掘技术的主要方法有:   统计分析方法,数据库字段项之间存在两种关系,函数关系和相关关系,即能用函数公式表示的确定性关系与不能用函数公式表示,但仍是相关确定性关系。即利用统计学原理对数据库中的信息进行分析。   神经网络方法,是一种模拟人脑信息加工过程的智能化信息技术。就像人的神经网络的过程一样,经过输入、分析、输出的过程,而在经济统计过程中得到实际应用。它为我们提供了一种完整的、准确的处理过程,使得经济运行模式就像人在接受处理信息的过程一样而形象化、具体化、实用化,更好地取得经济过程中各个部分之间的联系,从而获得对经济问题的分析,获得处理办法。   决策树是一种用于预测模型的算法,是基于统计理论的非参数识别技术,通过对大量数据的有目的分类,找到有价值、潜在的信息。正是由于分类速度快,描述简单,特别适合对经济运行过程中出现的大规模数据的处理工作。   粗集理论的方法,是一种研究不精确、不确定知识的数学工具,是通过对上下近似集来出来不确定问题。它算法简单,易于操作;不需要给出额外信息;简化输入信息的表达空间。对于不确定的经济因素提供了一种思维方法,正是通过这种近似原则,使得经济决策更加的与需求所接近,为最大利益化的获得给予有力支撑。   遗传算法,是一种根据生物自然选择与遗传机理的随机搜索算法,其思路是根据社会问题,在指定对象的人群中去采集信息,通过对隐含信息的整合、分析,进而得到结果。它具有隐含性、易于和其它模型结合,可以对隐含数据进行采集,而后把挖掘出的数据加以分析,进而得到应用。经济问题是一个发展变化的问题,内部有着千丝万缕的联系,参照遗传算法,我们就可以通过源头开始,一步步向下延伸,去提取数据,进行整体分析,这样就把经济问题具体化、直接化、目标化,使得问题的研究更加直观,把隐性的表现化,促使经济统计工作更加简单、直白。   三、数据挖掘流程在经济统计中的体现   定义问题,对于经济问题,要定义出所要探究的问题,确定数据挖掘的目的。1.数据准备,选择数据,数据预处理。即对所要探究的经济问题所涉及到的数据进行采集,做好前期的一些处理工作,使得数据得到简化,为后续工作的顺利进行做准备。2.数据挖掘,根据数据的类型和数据的特点选择相应的算法,利用人工智能、统计等方法,去发掘出有用的信息

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档