- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
C题 医保欺诈行为的主动发现
摘要
随经济的发展,社会医疗保险制度日益完善,国内医疗保险需求不断增加。同时,由于严重的医疗保险欺诈问题,造成了社会医疗费用的不合理增长,严重威胁着医疗保险制度的有效运行,因此反欺诈工作已迫在眉睫。在这种情况下,对国外已成功运营的医疗保险反欺诈组织体系进行研究显然具有重要的意义。医疗保险是社会保障体系的重要组成部分,随着医保改革的推进,医保范围不断扩大,成分日趋复杂,同时由于老龄化人口的不断增加等社会问题,医保基金的压力日趋明显。随着数据挖掘技术的不断发展与成熟,数据挖掘的研究和应用逐渐深入到各个行业中。在医疗保险领域中,维持医疗保险基金的收支平衡、对基金运营进行有效监管,以保证基金安全运营是一项重要的课题。遏制医疗保险欺诈行为,加强医保定点医院监管,推进医保反欺诈的技术化发展是防范和化解医疗保险欺诈的重要途径,M表示该数据库中消费的次数;
DB是指全数据库;
AD表示全消费集合是消费数据库中所有的消费集合;
为消费组合中消费的项目;
为消费组合DC 在消费数据库D中的常用度;
α 为一个规定的阈值;
p为 一 种消费方式;
FDC为常用消费组合集;
fDC表示常用消费组合;
为消费方式p与消费模式FDC的符合度;
γ为一个工作人员根据实际需要规定的阈值;
r表示相关系数;
称为FDC在D上的覆盖率;
T为数据库中满足约束的一条数据;
I称为项,项是频繁项集算法最基本的概念;
X为项集;
support(X)是支持项集 X 的事务数目与D中事务总数之比为项集 X 的支持度;
四、模型假设
假设1.患者是理性人。
假设2.医疗服务是同质的, 只有数量上的差异(实际中虽然显然有质的差别, 但我们可以以低质服务为数量的基本单元, 把高质的服务分解, 那么高质的服务就相当于多倍量的低质服务)。
假设3.个人账户余额是一静态的数值(尽管现实中这一数值是动态的, 但当我们只考虑患者某次看病的决策时, 个人账户余额是时点值, 因此被看做静态的常数是合理的)。
假设4.假设所有的相关数据具有独立性相呼影响。
假设5.假设不同人群间统济、统一管理和统一待遇水平。
假设6.假设单张处方药费特别高,一张卡在一定时间内反复多次拿药都可能是医保欺诈。
模型准备
对医保数据及欺诈的理解
基本医疗保险是社会保险的一种,它拥有社会保险的基本特征。所以医保数据有保险数据的特征,即有数据类型多、动态性和数据量大的特点,同时它还有以下特点:
存放数据的表繁多且关系复杂;
医保数据涉及的内容比较广泛,既有医疗单位的业务数据和医保中心的业务数据,又有参保人和参保单位的信息数据,还有各种数据库维护所需数据,因此存放这些数据的表非常多。
数据相对完整,空缺值较少;
由于医保中心对医疗单位的业务数据格式有要求,而医保中心的业务数据不是涉及参保人和单位、医疗机构的信息,就是关于医保基金流动的信息,所以数据库中的关键数据都比较完整,基本没有空缺值。存在不一致和无价值的数据大量空置和无用的或者错误的数据会影响整体数据的实用性和可操作性。
而且保险欺诈行为由来已久, 几乎从保险诞生之日起, 欺诈就如影随形, 其根源在于保险契约双方信息不对称引起的道德风险。理性人会自然地利用信息优势使自己利益最大化。医保欺诈涉及多方面关系,本篇论文具体从对患者的消费数据进行处理和分析,得到某个患者是否有欺诈行为。
对医保卡消费数据的预处理
2.1医保数据选择和集成
如附件所示,数据库中的数据大多与本课题无关,所以,我们首先了解了课题的背景知识,结和查阅相关文献资料的经验,最后从冗长的数据表中选取了有用的数据若干而这,将这些数据进行分组,并从新排列组合,删除不需要的行和列,由于数据的实用性和题目所问的方向性,所以只能舍弃这些数据。
异常数据挖掘的预处理
3.1 医疗消费数据库
医疗消费数据库是指数据库DB中满足一定条件的医疗消费的集合,一般用D表示,即
为消费记录,m为该数据库中消费的次数。消费数据库是数据库DB的子集,是根据需要构建的新数据库。全消费集合是消费数据库中所有消费的集合,一般用 AD表示。由于消费数据库D是数据库DB中满足一定条件的消费集合,所以全消费集合也是数据库DB中满足一定条件的所有消费的集合。比如,数据库DB中心脏病患者开具的消费集合就是一个消费集合,可见,对于同一个数据库DB,全消费集合不止一个,可以根据需要定义很多。
3.2 医疗消费组合
设 AD为全消费集合,若有集合DC 满足DC ? AD,则称DC 为消费组合。
可见,消费组合DC 是全消费集合 AD的一个子集,故消费组合也可以写成消费集合的形式:为消费组合,为消费组合组合中消费的项目。
3.3 消费组合常用度
设D为消费数据库, AD为全消费集合,有消费组合DC ?
您可能关注的文档
- 王志强-扬州大学-005-2011兽医药剂学-第3章.ppt
- 王志强-扬州大学-006-2011兽医药剂学-第4章.ppt
- 王志强-扬州大学-兽医药剂学.doc
- 王志强-扬州大学-药剂学-第1章.ppt
- 王志强-扬州大学-药剂学-绪论.ppt
- 王志强-扬州大学-004-2011兽医药剂学-第2章(下).ppt
- 网络环境下大学生自主学习能力的调查.pdf
- 网络学习对大学生学习行为的影响研究-以淮北师范大学教育学院为例.pdf
- 微功率光伏逆变器集成化平面化高频磁技术研究-毛行奎.pdf
- 微课件 兴奋在神经纤维上的传导.ppt
- 医学统计学(扬州大学)1绪论.pdf
- 医学统计学(扬州大学)8相关回归.pdf
- 医学统计学(扬州大学)5两样本比较.pdf
- 医学统计学(扬州大学)3第三章 概率和概率分布.ppt
- 医学统计学(扬州大学)Analysis of Variance - ANOVA.pdf
- 医学统计学(扬州大学)Goodness-of-fit Test 拟合优度检验.ppt
- 医学统计学(扬州大学)Analysis of Variance.ppt
- 医学统计学(扬州大学)Introduction to analysis of microarray data.ppt
- 医学统计学(扬州大学)Introduction to ANOVA.ppt
- 医学统计学(扬州大学)单因素方差分析.ppt
文档评论(0)