基于K-Means聚类的医保诈骗分析_建模校赛论文.pdfVIP

基于K-Means聚类的医保诈骗分析_建模校赛论文.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于K-Means聚类的医保诈骗分析_建模校赛论文

封一 答卷编号(竞赛组委会填写): 答卷编号(竞赛组委会填写): 论文题目:基于K-Means聚类的医保诈骗分析 参赛队员: 1.姓名:周堃野 学院:土木工程 学号:1201130631 电话 2.姓名:马鹏飞 学院:土木工程学号:0901130407 电话 3.姓名:徐恒超 学院:土木工程学号:1201130428 电话 封二 答卷编号(参赛报名号): 答卷编号(竞赛组委会填写): 评阅情况(评阅专家填写): 评阅1. 评阅2. 评阅3. 基于K-Means 聚类的医保诈骗分析 2015 年6 月7 日 摘要 向医保管理机构骗取医保基金或医保待遇的行为,严重威胁到医疗保险制度的稳定发展和医疗保 险的合理利用。本文通过对已知病人医疗记录的分析,探究了如何利用数据挖掘方式,并借助轮廓系数 法以及 K-MEANS++ 算法来从大量的数据中有效地寻找疑似骗保记录。 首先,根据医院科室治疗疾病类别的相对单一性,即在同一科室内的病人患病种类相似程度很高。 造成的病人在医嘱、用药、治疗时间、购药频数和购药总额等信息具有相似性。将患者以所属科室进行 分类,得到 75 个大类。而后,对患者的信息进行分析,我们发现附件中具有大量对结果不具有决定性 的信息,例如患者性别、患者年龄、患者医保卡所属类别和患者所在单位等。在筛选过后,我们保留了 附件2.2 中的相关数据作为数据源,并进一步加工,归纳,得到了最终模型所需要的四类数据。即,病 人ID、病人购药数量、病人购药总额和病人购药频数。 在确定骗保行为的过程中,我们将上面得到的 75 种大类患者,按照大类内人数进行分类。得到四 种类别:人数在个位数,人数在十到一百,人数在一百到两百和人数在两百以上四种类别。对于前三种 类别我们使用 EXCEL 进行数据分析,即可得到每个类中的疑似骗保人数;对于人数在二百以上的类 别,这种方法明显是不可取的。我们尝试利用数据挖掘的方法,进行聚类分析K-means 算法和孤立点 的判断法,得到了在大量数据中不符合常理的行为,即骗保行为。 综上所述,我们尝试性的解决了海量数据中,归纳-学习-发现骗保行为的问题。数据良好的反映了 现实。 1 目录 1 问题重述 3 1.1 问题背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 相关信息及待解决问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 问题分析 3 3 问题假设

您可能关注的文档

文档评论(0)

a888118a + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档