基于混合学习策略的企业信用评级研究（经济毕业论文）.docVIP

下载本文档

3
0
约5.4千字
约 8页
2021-09-05 发布于广东
举报
版权申诉

基于混合学习策略的企业信用评级研究（经济毕业论文）.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于混合学习策略的企业信用评级研究（经济毕业论文）文档信息主题：关于“金融或证券”中“金融资料”的参考范文。属性： F-0137LD，doc格式，正文3837字。质优实惠，欢迎下载！适用：作为文章写作的参考文献，解决如何写好实用应用文、正确编写文案格式、内容摘取等相关工作。目录 TOC \o 1-9 \h \z \u 目录 1 正文 1 搞要 1 关键字：半监督；非均衡数据分类；混合学习；企业信用评级 2 1 引言 2 2 基于混合学习策略的企业信用评级方法 3 3 实验设计 5 4 实验结果与分析 5 5 总结 6 参考文献 7 论文原创声明（模板） 7 论文致谢（模板） 8 正文基于混合学习策略的企业信用评级研究（经济毕业论文）搞要摘要：摘要：由于在实际企业信用评级中，通常存在着大量的未标记样本，同时在少量的有标记样本中，企业信用评级的数据往往呈现非均衡分布的特点，因此本文将半监督学习和非均衡数据分类方法结合起来，提出一种基于混合学习策略的企业信用评级方法，同时通过企业评级数据集对提出的方法进行实验验证关键字：半监督；非均衡数据分类；混合学习；企业信用评级 1 引言在现代经济生活中，信用作为市场经济的基础，对企业的生存和发展有着重要的影响。然而，企业信用缺失已成为制约我国经济可持续发展的突出问题之一，据相关资料统计，我国企业每年由信用缺失导致的经济损失高达6000亿元[1]。因此如何建立一个适用的企业信用评级模型，强化企业信用风险管理，已成为学术界和产业界迫切需要解决的问题。目前在企业的信用评级领域，常见的企业信用评级方法主要有基于统计分析的方法和基于机器学习的方法，其中根据建立判别函数形式和样本的假定不同，基于统计分析的方法主要有一元判别模型、多元判别模型、Logistic回归模型、Probit 模型等[2]。由于基于统计分析的方法对样本数据都有严格的假设条件，如多元正态分布、等协方差等，在现实中这些假设一般都不成立，极大地限制了基于统计分析方法的应用。因此，基于机器学习的方法越来越多地被应用到企业信用评级中[3]。基于机器学习的方法需要构建一个具有良好性能的财务风险预测模型，这就需要大量的有标记样本，然而在企业信用评级实际应用中，通常存在着大量的未标记样本，有标记样本相对较少，与此同时，在少量的有标记样本中，企业信用评级的数据集往往呈现非均衡分布的特点，因此，本研究提出了基于混合学习策略的方法，用来解决企业信用评级中存在的问题。基于混合学习策略的方法是一种把半监督学习和非均衡数据分类方法结合起来的学习方法，它利用少量的有标记样本和大量的未标记样本，将非均衡数据分类方法引入到半监督学习方法中，从而形成一种混合学习策略的企业信用评级方法。通过本研究，丰富和完善了企业信用评级研究的理论研究体系，为及时准确地预测企业的信用风险提供了行之有效的方法，加强了企业的信用风险管理，保护了企业利益相关者的利益，具有重要的意义。 2 基于混合学习策略的企业信用评级方法自训练方法自训练算法是最早提出的半监督学习方法，也是半监督学习中较为常见的方法之一。它通过已有的少量有标记样本训练出分类器，然后利用该分类器预测大量未标记样本的类别，选出置信度较高的样本加入到训练集中重新训练，重复执行以上过程，直到满足条件为止[4]。算法的流程如图1所示。非均衡数据分类方法基于取样的非均衡数据分类方法基于取样的方法主要是将原本非均衡的样本类别变得均衡，从而提高分类器对少数类样本的分类准确率，常用的基于取样的方法有欠取样方法（Under Sampling）和过取样方法（Over Sampling）[5]。欠取样方法通过随机去掉多数类样本来降低数据集的非均衡程度，但这种方法会丢失多数类的一些重要信息；而过取样方法与欠取样方法相反，它通过随机复制少数类样本的方式来使数据集达到均衡，这种方法虽然保留了已有样本的所有分类信息，但容易造成分类器的过度拟合。为了克服上述随机欠取样和过取样方法存在的缺点，研究者提出了SMOTE取样方法，它根据一定的规则，在一些相距较近的少数类样本间加入“合成”样本，随机生成新的少数类样本，并将这些新生成的少数类样本加入到原来的数据集中，从而对少数类样本进行扩充，产生新的训练数据集。通过SMOTE方法增加的少数类样本并不存在原来的样本中，因此SMOTE可以避免过取样的缺陷。基于集成学习的非均衡数据分类方法基于集成学习的方法通过训练多个分类器并将其结果按照一定的方式进行有效的组合，以此来获得比单个分类器更好的性能。当前，构建集成学习的方法主要有Bagging和Boosting方法[6]。Bagging方法首先对原始的训练样本集进行有放