- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
— PAGE \* Arabic 1 —
基于聚类的个人信用评分模型研究
邮局订阅号:82-946360元/年技术创新 金融电子 《PLC技术应用200例》 您的论文得到两院院士关注 徐向阳:讲师 基于聚类的个人信用评分模型研究 ResearchonPersonalCreditScoringModelbasedonClustering (1.河南公安高等专科学校;2.河南师范大学)徐向阳 1 葛继科 2 Xu,XiangyangGe,Jike 技术创新 中文核心期刊《微计算机信息》(管控一体化)2006年第22卷第9-3期 360元/年邮局订阅号:82-946 《现场总线技术应用200例》 金融电子 量,并产生一个公式。信用评分模型的统计方法有:线性概率模型、Logit模型、Probit模型、 以及判别(Discrim-inant)分析方法。 2.2数据挖掘方法 数据挖掘(DataMining,DM)是为了发现事先未知的规则和联系而对大量数据进行选择、探索和建模的过程,其任务可以分为两类:描述和预测。用于个人信用评分的常用方法包括分类、聚类、关联规则分析、预测、孤立点检测等。 1.分类(Classification):按分析对象的属性、特征建立不同的组类来描述事物。它基于对类标记已知的数据对象的分析,导出描述并区分数据类或概念的模型(或函数),用以预测类标记未知的对象类,导出模式可以用分类规则、判定树、数学公式或神经网络等形式表示。 2.聚类(Clustering):根据“ 物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据 对象叫做簇,并且对每一个这样的簇进行描述的过程。其目的是使得属于同一个簇的对象应该彼此相似,而不同簇的对象应该足够不相似。 3.关联规则分析(Associationruleanalysis):某种事物发生时其他事物会发生的一种联系,这些规则展示属性-值频繁地在给定数据集中一起出现的条件,关联规则形式:X=>Y[S%,C%],其中,X、Y是空间或非空间谓词的集合,S%表示规则的支持度,C%表示规则的置信度。 3基于决策属性的分类-聚类个人信 用评分模型 就个人信用评分建模问题而言,待建模数据库假设为一个信用数据库,它是一个由属性、元组组成的二维表,称之为信用决策表。属性分为条件属性和决策属性,各条件属性的取值可以是某段区间的连续值,也可以是多个离散值,决策属性取值为百分制。初始样本集根据决策属性的分数作区段划分,得到多个大类别,为了进一步精确化,再对每一个大类别进行聚类分析,得到多个子聚类,对每个子聚类建立一个能拟合包含在其中的训练样本的子模型。 设训练样本集为S ,S 中共有N个样品,可以把它看作一个数据库,S的每个样品是一个元组(即<属性,值>对),根据决策属性的取值对训练样本集进行类别划分,划分后可记为:S1,S2,...,Sk,共K类样本子集。对第i类的样本子集Si进行聚类分析,可得到Ni个子聚 类Cji(第i类的样本子集Si的第j个子聚类)。 这里i=1,2,…,K,j=1,2,…,Ni,。对每个子聚类Cji可建 立一个子模型来拟合描述这个子聚类中的所有样本。如图1所示。 按照上述方法,可以得到一个分类—聚类树,对于基层的子聚类,当某些子聚类满足一定的条件时就可以合并(融合)。设A={C1,C2,...,Cm},B={Cm+1,Cm+2,...,Cn} 分别为某空间中的由多个子聚类组成的集合。集合A 中的Ci(i=1,2,…,m)与集合B中的Cj(j=m+1,m+2,…,n)能否合并,可由以下判别方法决定: ①若子聚类Ci的中心在Cj的边界所构成的区域内,且Ci与Cj有部分或全部空间重叠,则Ci可与Cj合并; ②若子聚类Ci的中心在Cj的边界所构成的区域外,但Ci与Cj有部分空间重叠,此时需根据空间的比例及实际情况判断Ci与Cj是否可合并; ③若子聚类Ci与Cj完全不重叠,则Ci与Cj不能合并。 针对每个子聚类,具体的建模方法可以使用基于粗糙集的神经网络建模方法、神经网络二分类法、径向基函数RBF学习算法、范例类比模型法和模糊C-均值聚类算法(FCM)等。 也可以采用RBF中的子聚类区域高斯函数描述法来确定
您可能关注的文档
最近下载
- 苏S13-2022 预制混凝土排水检查井工程图集规范 .docx VIP
- 一种钛合金离子渗氧的方法.pdf VIP
- 冀人版(2024)小学科学一年级下册《认识自然物和人造物》说课课件.pptx VIP
- 2025人教版英语八年级上册全册教学设计教案.pdf
- 刮研方法与 技巧.ppt VIP
- 摄影笔记完整版.docx VIP
- 工课:即将失传的轴瓦刮研-王震.pdf VIP
- T_CEA 0052.2-2025《电梯电缆及线束试验方法 第2部分:电气性能》.docx VIP
- T_CEA 0052.1-2025《电梯电缆及线束试验方法 第1部分:机械物理性能》.docx VIP
- 陕西省专业技术人员继续教育2025公需课《党的二十届三中全会精神解读与高质量发展》20学时题库及答案.docx VIP
原创力文档


文档评论(0)