2015深圳杯优秀论文.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2015深圳杯优秀论文

医保欺诈行为的主动发现 摘 要 随着我国医保制度推广范围的不断扩大,以及管理上存在的一定程度的疏忽, 医保欺诈现象越发严重,造成了医疗资源的分配不公和公众利益的损失。 本文着眼于分析医保欺诈的三种常方式 ,探讨这些行为所具有的不同 特征,对这些手段,分别设计了检测方法,建立了三种不同的数学模型。 模型一对一张卡在一定时间 次药。对此我们可以统计出每张卡在 医院开药单的时间频率,同时还必须探究开药频率和病人自身属性的关联性,通过 比较数据在不同分类水平下的频率直方图,进一步通过列联表法检验了不同病人属 性下就诊频次之间的独立性是否存在,通过 制式图 ,通过分位数界定了一部 分离群点,作为高度怀疑的对象。 模型对于单张方药过高进行别。对于特定类型的病人,医生往往会有 对应的开药模式,若某些外在因素相似的病人,在开药模式上呈现出很大的差异 性,则有理由怀疑为行为异常者。对此,我们采用了在无监督机器学习 ,建 立了能过器模型 ,对于数据库中的离散分类数据和连续变量分别采用 SDLE , SDEM方法,引入高合模型刻画其概率密度,基于新数据点对原有数据分布的 影响大小,计算了 Hellinger Distance Logarithmic Loss作为得分,得分越 高代表该数据点在与其类似的数据点中行为越异常,理论上结合经验阈值可以转 化为有监督机器学习模型来优化原有模型。 模型三探测一人卡配药的。因为不同的病人去医院开药的行为通常是 相互独立的,如果若干张医保卡在开药行为上存在高度的一致性,则很可能这些医 保卡为同一人在使用。为探测这种关联性,采用了 Eclat 关联则算法 ,对庞大的 数据库按时序进行数据挖掘,提高度频繁项集 ,作为怀疑的对象。 我们队以上模型都基于现有数据库进行了模型仿真,对结果进行了评价,得到 了合理的结果,并对模型的进一步完善提出了展望。 关 无监督机器学习, 列联表, Hellinger 距离, 对数损失, Eclat, 频繁项集 1 1 问题重述 的的 的的的 重题求附的建立模型求解问题 1. 的 2. 的 3. 重的 2 问题分析 问题的 的的 的的的的 的分析 问题的 模的模本 的的本题 的的 问题 的本文 的的的 3 模型基本假设 1. 2. 参的分 4 模型的建立与求解 4.1 模型的 题的的 的的 的的 的 的: 的的 2 附 的本的 的附的录 的的 的重 附的的 rowid 的的 Q : 的分 Q : 的分 ∆Q: 分的 4.1.1 的 分8 0 70 10 分70 的的 的分 1 1: 述的的分 与立与立立的 的立 1 假设与立 ∑ ∑ (n − npˆ pˆ ) · · χ = npˆ pˆ · · pˆ = ,pˆ = · · 3 1: 1 2 3 4 5 6 7

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档