- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘分类技术在财务管理中应用
数据挖掘分类技术在财务管理中应用
一、数据挖掘及分类技术的含义
数据挖掘是从大量的数据中挖掘出隐含的、未知的、用户可能感兴趣的和对决策有潜在价值的知识和规则。
这些规则包含了数据库中一组对象之间的特定关系,揭示出一些有用的信息,可以为经营决策、市场策划和金融预测等方面提供依据。而数据分类是基于数据挖掘的一种有监督的分类学习方法,其目的是从一组已知类别的数据中发现分类模型,以预测新数据的未知类别。
二、数据分类技术比较及数据挖掘的步骤
(一)数据分类技术的主要方法。基于数据挖掘的分类技术的主要方法有决策树、神经网络、遗传算法、粗糙集、贝叶斯分类、K-近邻、支持向量机、回归分析以及多策略分类等。
1、决策树。决策树分类法的优点是分类的准确率高,学习速度比较快,能够表示成容易理解的分类规则和能够使用数据库的SQL语句来实现;其缺点是很难基于多个变量的组合发现规则,不同决策树分支之间的分裂不平滑,而且当类别较多时,分类的准确度明显下降。
2、神经网络。神经网络分类法的优点在于其分类精度高,能发现非线性的模式,不需预先对试验样本的统计分布做假设而且具有良好的鲁棒性、自组织自适应性、可并行处理、分布存储和高度容错性。其缺点首先是模型的构造是黑箱操作,网络的学习和决策过程难以理解;其次是结果难以表示成简单的分类规则;再次是样本数据要求是数值类型,分类型数据要做离散化处理,最后是结果与网络的拓扑结构和初始的权系数有关。
3、遗传算法。遗传算法分类法的优点是其具有群体搜索、隐含的并行处理、通用性和鲁棒性及概率转移准则。而其缺点在于学习速度比较慢、结果与编码方式、遗传算子和运行参数密切相关和基因编码和目标函数的选择比较复杂。
4、粗糙集。粗糙集分类法的优点是不需要预先知道额外信息算法简单和易于操作。其缺点是由于其基于集合论,难以直接处理连续的属性;还有当属性值的个数较多时,规则表示复杂;再就是其产生的规则需要合并处理。
5、贝叶斯。贝叶斯分类法的优点是???以处理不完整和带有噪声的数据,解决数据间的不一致问题,而且其用图形方法描述数据间的相互关系,语义清晰,可理解性强,另外还具有不确定性的知识表达形式、丰富的概率表达能力、综合先验知识的增量学习特性等优点。其缺点是对于简单贝叶斯分类假设属性是相互独立的。
6、K-近邻。K-近邻分类法的优点是简单、应用范围广,可以通过SQL语句实现,且模型不需要预先构造。其缺点是需要大量的训练数据,并且搜索邻居样本的计算量大,会占用大量的内存;还有就是距离函数的确定比较困难和分类的结果与参数有关。
7、支持向量机。支持向量机分类法的优点是适合小样本的数据,可给出学习结果的推广能力的界,能有效地处理非线性分类和非线性回归,还有就是其计算量与样本向量的维数几乎无关;其缺点是当解决多类别的分类问题时比较困难,另外核函数的选择和参数的确定也比较复杂。
8、回归分析。回归分析分类法的优点是其有数据理论为依据;其缺点是其需要确定模型参数,数据分布不一定符合预先的假设,另外不能处理离散性数据,模型也难以用简单的形式描述。
9、多策略分类。多策略分类法优点是其包括两种以上的分类方法,而其大多具有图形界面,使用方便;其缺点是要由用户选择具体的分类方法,并需要进行多次测试。
(二)数据挖掘的基本步骤。SEMMA方法是目前最受欢迎的一种数据挖掘方法,其描述的数据挖掘的大致过程包括取样、探索、修改、模型和评价。
1、数据取样。在进行数据挖掘之前,首先要根据数据挖掘的目标选定相关的数据库。通过创建一个或多个数据表进行抽样。所抽取的样本数据量既要大到足以包含有实际意义的信息,同时又不至于大到无法处理。
2、数据探索。数据探索就是对数据进行深入调查的过程,通过对数据进行深入探察以发现隐藏在数据中预期的或未被预期的关系和异常,从而获取对事物的理解和概念。
3、数据调整。在上述两个步骤的基础上对数据进行增删、修改,使之更明确、有效。
4、建模。使用人工神经网络、回归分析、决策树、时间序列分析等分析工具来建立模型,从数据中发现那些能够对预测结果进行可靠预测的模型。
5、评价。就是对从数据挖掘过程中发现的信息的实用性和可靠性进行评估。
三、数据挖掘及分类技术在财务管理中的应用
(一)成本分析。管理者坚信对成本的精确计算和对资源的充分利用可以有效地改善企业的业绩,但其复杂的操作使得很多管理者望而却步。利用数据挖掘中的回归分析、分类分析等方法能帮助管理者确定成本动因,更加准确计算成本。同时,也可以通过分析成本与价值之间的关系,确定采用其最佳策略的成本,持续改进和优化企业价值链。
您可能关注的文档
最近下载
- 涉密运行维护管理制度.docx VIP
- MobileFlow-大模型驱动的终端自动化测试新范式-2025研发效能最佳实践.pdf VIP
- OPPO企业AI赋能研效提升的应用与原理解析-2025研发效能最佳实践.pdf VIP
- 《第四单元 西方音乐发展史掠影学习学习项目二 音乐中的浪漫主义》七年级上册音乐人教版 教案(表格式)(2024新版).docx
- T∕CACM 1090-2018 中医治未病技术操作规范 穴位敷贴.docx VIP
- 学科教学与综合育人能力提升谈谈个人见解与感悟.docx VIP
- 新解读《GB_T 35070.3-2018停车场电子收费 第3部分:交易流程》.docx VIP
- 1 《中国人民站起来了》课件(共61张PPT)统编版高中语文选择性必修上册.pptx VIP
- CMF:中国宏观经济专题报告(第98期):读懂价格信号,稳住经济大盘.pdf VIP
- 字节跳动 研发效能提升之道-2025研发效能最佳实践.pdf VIP
文档评论(0)