企业管理二分类问题研究综述.docVIP

下载本文档

0
0
约3.4千字
约 6页
2017-01-23 发布于北京
举报
版权申诉

企业管理二分类问题研究综述.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

企业管理二分类问题研究综述.doc

企业管理二分类问题研究综述　　摘要：通过梳理企业管理领域的二分类问题，发现二分类支持向量机广泛应用于客户流失预测、上市公司财务困境预警和信用风险评估。并且为了提高预测精度，学者不断改进该模型：为适应具体数据特征，如数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等，相应引入模糊、加权、双隶属支持向量机以及代价敏感性学习机制等。　　关键词：二分类支持向量机（SVM）企业管理综述　　1 概述　　当前，企业管理领域中的客户流失预测、公司财务困境预警、信用风险评估已成为学术界和业界关注的焦点，能否科学合理的对其进行预测，关乎企业生存和发展。利用客户静态属性数据，预测客户是否流失；利用公司财务、经营情况，预测上市公司是“财务状况正常”或“财务状况异常”；利用借款人财务、非财务状况，预测其信用状况是“正常”或“违约”。虽然上述3领域研究方向差异性大，但研究使用方法相似，因此将上述3领域研究统称为经济与管理科学领域二分类问题研究，简称二分类问题研究。　　以上二分类问题研究利用判别分析，取得了相对准确的理论结果，但该方法需要很强的假设和限制条件，而这些条件在实际分析中通常得不到满足。近年来，随着人工智能学科的发展，学者引入神经网络，并取得了优于判别分析法的结果。但神经网络很可能陷入局部最优，无法得到全局最优，同时它是基于经验风险最小化原理，经常出现“过拟合”现象。1995年Vapnik提出支持向量机模型（Support Vector Machine，SVM），一种基于结构风险最小化的算法。之后学者将SVM进入上述二分类问题研究，发现其泛化能力、预测精度都高于判别分析、神经网络。　　近年来，为提高二分类问题研究中SVM预测精度，学者不断探索如何改进二分类SVM，有效降低样本数据外点或噪声点、非平衡性、重叠性及错分代价差异性的影响。　　本文结构安排如下：第一部分是引言，第二部分是考虑样本特征的改进支持向量机，第三部分是结论与展望。　　2 改进支持向量机　　随着人工智能领域的快速发展，学者将传统支持向量机（C-SVM）引入二分类问题研究：Min和Lee将C-SVM引入上市公司财务困境预测，夏国恩等将C-SVM引入客户流失预测，发现C-SVM优于传统判别分析、神经网络。但此阶段仅限于对模型的简单应用，未充分考虑样本数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等。　　2.1 外点或噪声点　　当数据集中存在外点或噪声点时，容易使二分类SVM结果不理想，为此Liu和Huang将模糊化思想引入SVM，提出了模糊支持向量机（FSVM），根据数据点对所在类（正类、负类）的相对重要程度，分配不同的权重，以降低外点和噪声点影响。杨海军、太雷将模糊支持向量机（FSVM）算法引入上市公司财务困境预测，对沪深两市按行业板块分类的上市公司实证分析，显示该模型预测优于C-SVM。　　2.2 重叠性　　传统SVM将样本集绝对分为互斥的两类，但现实世界中这种分类不存在经济意义，即样本很可能存在重叠性，例如财务困境预测时，财务指标既定的企业，可能由于经营远离财务困境，也可能由于经营不力而陷入财务困境。　　考虑样本数据重叠性、外点或噪声点，Wang等构建了双隶属模糊支持向量机（B-FSVM），使每个样本点依据隶属函数同时属于两类，并利用3个公开信用数据库实证分析，发现B-FSVM判别能力高于C-SVM和FSVM。阚宝奎、刘志新等[1]将B-FSVM引入上市公司虚拟财务报告识别，其中样本点对于两类样本的隶属程度确定采用谱聚类方法。研究发现，该模型的判别准确率、泛化能力都显著优于C-SVM、BP神经网络，且可以显著降低将虚假财务报告识别为真实财务报告的错误。　　张目、周宗放[2]采用多目标规划，减少两类样本企业信用状况的重叠。基于TOPSIS法，分别以“正常企业”样本逼近理想点、“违约企业”样本逼近负理想点为目标，构建多目标规划模型；运用实码加速遗传算法求解得出指标综合权重，通过构造加权样本，减少两类样本企业信用状况的重叠，进而提高SVM预测精度。选取沪、深股市中具有“高新技术概念”上市公司作为实验样本，实证分析得出，该方法一定程度上利于两类样本的正确区分，使SVM的预测精度提高。　　2.3 非平衡性　　经济与管理科学中的二分类问题数据大多存在非平衡性，而非平衡性会对C-SVM分类效果产生不利影响，即C-SVM只会对数量上占优的类别具有很强的识别能力[3]。解决数据非平衡性可使用向下采样方法或构建相应模型。向下采样方法：以客户流失预测为例，从非流失客户中抽取部分样本与流失客户样本构成k：1的训练集。这种方法虽然平衡了训练集类分布，但损失了很多信息，且抽取比例、k取值确定需要多次尝试和实验。