- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在经济运行中应用探究
数据挖掘在经济运行中应用探究 摘 要:随着信息技术特别是网络技术飞速发展,人们收集、存贮、传输数据能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是,对决策有价值的知识却非常匮乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科,数据挖掘是当前数据库和信息决策领域的最前沿研究方向之一,数据挖掘技术对经济预测能取得很好的效果。
关键词:数据挖掘;功能;内容;步骤
中图分类号:F0 文献标志码:A 文章编号:1673-291X(2013)33-0007-02
收稿日期:2013-08-19
作者简介:张琼(1969-),女,浙江杭州人,助理会计师,从事企事业单位经济管理研究。
一、数据挖掘与功能
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一门交叉学科,汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域。现代统计学充分运用了自动化的数据搜集、整理与分析技术,其目前面临的最大课题就是处理大量、复杂数据的能力。由于传统的统计推断局限在小样本,无法处理大量、复杂的数据集,数据挖掘的出现则大大增强了统计学的的数据处理能力,也给统计学的理论研究提出了新的课题,极大地推动了统计学的发展。数据挖掘的过程也叫知识发现的过程。
1.分类。按照分析对象的属性、特征,建立不同的组类来描述事物。例如,银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。
2.聚类。识别出分析对内在的规则,按照这些规则把对象分成若干类。例如,将申请人分为高度风险申请者、中度风险申请者、低度风险申请者。
3.关联规则。关联是某种事物发生时其他事物会发生的这样一种联系。例如,每天购买啤酒的人也有可能购买香烟,比重有多大,可以通过关联的支持度和可信度来描述。
4.预测。把握分析对象发展的规律,对未来的趋势做出预见。例如,对未来经济发展的判断。
5.偏差的检测。对分析对象的少数的、极端的特例的描述,揭示内在的原因。
二、数据挖掘技术的内容
数据挖掘是进行信息处理的系统工具,按照信息处理的流程来分类,一般有三种类型:信息发现、预测模型和异常分析。信息发现是指单纯地对信息进行处理、整理和分析,以发掘出蕴涵在信息之间的潜在的有价值的知识或者联系,但并不进行对信息处理结果的预测。信息发现包括条件逻辑推理、关联处理和信息规律趋势和变化等;预测模型是指通过上一阶段的信息处理,利用有价值的知识资源和预测模型对其进行发展趋势预测,这包括结论预测和发展趋势展望等;异常分析是指数据挖掘的扩展阶段,对发现的异常情况作出分析,包括偏离侦测和关联分析等。总的来说,数据挖掘技术通常有六种手段进行信息处理:分类、回归模型、时间序列、聚类、关联分析和序列发现。分类和回归模型一般用于趋势预测,关联和序列发现用于分析客户行为,聚类则可用于以上两种情况。数据挖掘技术按对信息的处理方式分为数据保存技术和数据提炼技术两种方式。数据保存技术主要是能够方便地为企业决策提供信息帮助,在企业决策中应用案例分析(CBR)来保证经营决策的有效性。但是企业要想获得蕴涵在信息之中的有价值的知识,就必须使用数据提炼技术,数据提炼技术包括:逻辑方法是运用多维或者OLAP技术对量化的或者非量化的数据进行统一模式的处理,包括规则公式和决策树;横向对比主要是对定性数据指标进行类比分析,包括类比中介和可信网络;程式分析是能够有效地应用多维模型和数理统计方法对大规模的数据进行处理,包括数理统计方法和神经网络等。
三、数据挖掘步骤
1.确定应用领域。包括此领域的基本知识和目标。
2.建立目标数据集。选择一个数据集或在多数据集的子集上聚焦。
3.数据预处理。在大数据集中,根据需求,利用数据净化和整合技术,选择与任务相关数据,在不降低其准确度的状况下减少处理数据量。
4.数据转换。找到数据的特征进行编码,减少有效变量的数目。
5.数据挖掘。根据数据和所要发现知识的种类来确定相应的挖掘算法。
6.数据评价。将挖掘出的知识和数据以各种可视化方式显示,并将其以图形、文本等方式存储在库中,以便对它们进一步挖掘,直至满意为止。
7.实施和应用。利用数据挖掘技术所建立模型在实际项目中的应用,包括数据库的构建,个性化用户服务、基于知识的企业信息管理(MIS)、企业目标管理、决策支持等等。
四、数据挖掘在经济运行中应用
以大数据为创新驱动的金融改革能够缓解小微企业融资困难,促进信息消费升级,加快民间资本对金融业的支持,更灵敏的防范金融风险,成为中国经济结构调
文档评论(0)