2015深圳杯优秀论文.pdfVIP

下载本文档

145
0
约3.81万字
约 24页
2018-09-16 发布于浙江
举报
版权申诉

2015深圳杯优秀论文.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2015深圳杯优秀论文

医保欺诈行为的主动发现摘要随着我国医保制度推广范围的不断扩大，以及管理上存在的一定程度的疏忽，医保欺诈现象越发严重，造成了医疗资源的分配不公和公众利益的损失。本文着眼于分析医保欺诈的三种常方式，探讨这些行为所具有的不同特征，对这些手段，分别设计了检测方法，建立了三种不同的数学模型。模型一对一张卡在一定时间次药。对此我们可以统计出每张卡在医院开药单的时间频率，同时还必须探究开药频率和病人自身属性的关联性，通过比较数据在不同分类水平下的频率直方图，进一步通过列联表法检验了不同病人属性下就诊频次之间的独立性是否存在，通过制式图，通过分位数界定了一部分离群点，作为高度怀疑的对象。模型对于单张方药过高进行别。对于特定类型的病人，医生往往会有对应的开药模式，若某些外在因素相似的病人，在开药模式上呈现出很大的差异性，则有理由怀疑为行为异常者。对此，我们采用了在无监督机器学习，建立了能过器模型，对于数据库中的离散分类数据和连续变量分别采用 SDLE ， SDEM方法，引入高合模型刻画其概率密度，基于新数据点对原有数据分布的影响大小，计算了 Hellinger Distance Logarithmic Loss作为得分，得分越高代表该数据点在与其类似的数据点中行为越异常，理论上结合经验阈值可以转化为有监督机器学习模型来优化原有模型。模型三探测一人卡配药的。因为不同的病人去医院开药的行为通常是相互独立的，如果若干张医保卡在开药行为上存在高度的一致性，则很可能这些医保卡为同一人在使用。为探测这种关联性，采用了 Eclat 关联则算法，对庞大的数据库按时序进行数据挖掘，提高度频繁项集，作为怀疑的对象。我们队以上模型都基于现有数据库进行了模型仿真，对结果进行了评价，得到了合理的结果，并对模型的进一步完善提出了展望。关无监督机器学习, 列联表, Hellinger 距离, 对数损失, Eclat, 频繁项集 1 1 问题重述的的的的的重题求附的建立模型求解问题 1. 的 2. 的 3. 重的 2 问题分析问题的的的的的的的的分析问题的模的模本的的本题的的问题的本文的的的 3 模型基本假设 1. 2. 参的分 4 模型的建立与求解 4.1 模型的题的的的的的的的的: 的的 2 附的本的的附的录的的的重附的的 rowid 的的 Q : 的分 Q : 的分 ∆Q: 分的 4.1.1 的分8 0 70 10 分70 的的的分 1 1: 述的的分与立与立立的的立 1 假设与立 ∑ ∑ (n − npˆ pˆ ) · · χ = npˆ pˆ · · pˆ = ,pˆ = · · 3 1: 1 2 3 4 5 6 7