- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第24 卷第2 期 Vol.24 No.2
广东工虫大学学报
2∞7 年6 }l Journal of Guangdong University of Technology June 2∞7
基于 SPRINT 分类算法挖掘
保险业务数据中的风险规则
宾宁
(广东工业大学经济管理学皖,广东广州1510520)
撞要:提出利用 SPRINτ 算法对保险业务数据进行风险分析.针对医疗保险业务,详细介绍了 SPRINT 算法的预处
理J十算最佳分裂、执有分裂的具体设计实现过程,并得出一些实用的风险规酣
关键词: SPRINT 算法;分类算法:数据控掘;保撞业务
中圄分类号:TP301. 6
文献标识码;A
文章编号:1∞7-7162(2∞7)02船99-04
数据控掘(Data Mining) 就是JJ5L用一系列技术从
吕前常用的分类算法有决策树分类算法、Bay部分类
大型数据库或数据仓库中提取人10感兴趣的信息和 算法、基于关联规划的分类算法以及基于数据库技
术院分类算法等[6J 其中,决策辛苦算法产生的规则易
知识,这些知识或信息是隐含的,事先未知而潜在有
厚的,提取的知识表示为概念、规期、规律、模式等形
于理解,决策树的每个分枝都对应一个分类规划,商
式[1-2J 也可出说,数据挖提是一类深层次的数据分
旦其速度较快、准确率较高肘,西此,常选择决策树
析.近十凡年来,随着人盯利用信息技术生产和收集 算法来进行保险韭务的风险分轩.
数据的能力的大福度提高,数据挖掘被越来越多地 SPRINT 算法是 John Shafer 和 Rakesh Agrawal
应用于大中型企业、商业、银有、保险业和电信业各 于 1996 年提出的针琦大型数据库能一种高速可伸
部门,表现出极强的发展潜力[3]
缩的数据拮据分类算法[8J 它能处理分类高性和连
续值属性_SPRINT 算法使用预排序技术,对非常大
随着我国经济体制改革的深人发展和对外经济
而不能放入内存的驻留磁盘的数据集进行预排
开放,全社会的风险意识和保险意识不黯增强,保险
序[9J 为了减少需要驻留于内存的数据量,SPRINT
作为风险管理的重要方法日益受到重视.保险公司
成功的一个关键因素是在设置具有竞争力的保费和 算法进一步改造了决策树算法实现时的数据结构,
覆盖风险之间选择→种平衡.对于保险公司来说,保 将类别列合并到每个露姓列表中.这样,在遍历每个
属性列表寻找当前结点的最拢分裂际准时,不必参
险是一项风险业务,其重要工作之一就是进仔风险
评估,吾前保险公司对风险的分析通常是租略的或 照其他信患.丽对节点的分裂表现在对属性列表的
根据经验来判断的.数据挖掘提供了进行保跄投资 分袭,即将每个暑性列表分成两个,分射存放属于各
组合数据库分析的环境,数据挖握的多种方法可用 个节点的记录.当表划分时,表中记录的次序维持不
来进行风撞分斩[4j
文档评论(0)