- 10
- 0
- 约1.06万字
- 约 3页
- 2018-11-27 发布于天津
- 举报
基于R的Apriori算法在高额住院费用中的应用研究-中国卫生统计
中国卫生统计2017年4月第34卷第2期 ·315·
基于R的Apriori算法在高额住院费用中的应用研究
△
成都市第三人民医院信息部(610031) 郭慧敏 杜 军 黄路非
【提 要】 目的 通过Apriori算法分析高额医疗费用患者相关指标之间的关系,试图找到影响医疗费用的因素,利
用R扩展医学统计的工作思路。方法 利用R软件中的arules包对2015年某院出院的高额治疗费用患者做关联规则分
析,探索出院科室、住院天数与总费用,出院科室与性别,出院科室与药费,出院科室与有无手术的关联规则,并分析其原
因。结果 某些科室住院天数越多,费用越高;而某些科室的住院天数与费用没有太大关系;胸外、心内、神外、ICU、心外
五个病区出院的高额费用患者通常为男性;呼吸、ICU、心外、胸外、神外五个病区出院的高额费用患者的药费一般大于2
万元;心外、胸外、骨科等病区的高额医疗费用的出院患者通常要行手术治疗手段。结论 Apriori算法可以挖掘数据间内
在的关系,为临床决策提供一定的理论支持,R语言可以快捷的完成医学统计工作。
【关键词】 R语言 关联规则 高额住院费用 数据挖掘
目前新一轮医疗改革正在如火如荼的进行中,各 用、药费等字段;由于在数据分析过程中只能对离散变
方对医疗改革保持了非常高的关注度;当下,看病难、 量进行分析,故需将某些字段进行离散化处理,例如数
[1] 据挖掘需要用到是否手术字段,但是在原始数据中并
看病贵成了医患矛盾的主要集中点 ,而看病贵的一
个重要构成就是患者住院期间的医疗费用过高。高额 未提供该字段,需将获得数据中存在手术名称的标记
医疗费用患者往往为危急重症病人,其主要特点为单 为有手术,而无手术名称的记为无手术。
次花费巨大,消耗大量的医疗资源,这极易给家庭和社 2统计学方法
[10]
会造成沉重负担,部分患者难以承受巨额费用,导致因 R语言是专门为统计而设计的语言 ,R语言能
[2] 够为不同的统计功能提供多种实现途径,它是一套开
病致贫、因病返贫 。另外,高额的医疗费用也容易
造成医患关系紧张,这也是滋生医闹等现象的主要诱 源的数据分析解决方案,其完全免费,对于统计工作者
因。面对这样的境况,严控医疗费用不合理的增长成 非常友好,而且在全球有一个庞大且活跃的研究型社
[3] [11]
为亟待解决的社会问题 。 区维护 。本文主要利用 R语言中arules包中的
关联算法是一种常见的数据挖掘手段,它可以发 apriori()函数进行关联规则提取,在规则提取过程中,
现一个事物与其他事物之间的关联和相关性;在我国, 设定最小支持度为0020且最小置信度为0500为强
该方法在中医学中的应用非常广泛[4-5],在医学其他 关联规则[12],得到强关联规则后,筛选出提升度大于
领域的应用逐渐增加。本文通过整理高额医疗费用患 1的强关联规则做分析;其中R的版本为331,arules
者的病案首页信息,利用Apriori算法查找符合条件的 包的版本为14-1。
[6]
关联规则 ,以期分析高额费用患者各个指标之间的
结 果
[7]
相互关系 ,通过关联规则的关系梳理找到高额费用
[8]
您可能关注的文档
最近下载
- 化工安全技术与环境保护 教学课件 作者 刘景良 主编 第七章化工装置安全检修.ppt VIP
- 党工委书记2025年度组织生活会个人对照检查材料(五个对照).docx VIP
- 吉林省风电场信息表.doc VIP
- 22J603-1 铝合金门窗(建筑图集).docx
- 化工安全技术与环境保护 教学课件 作者 刘景良 主编 第六章电气安全与静电防护技术.ppt VIP
- 冠林AH3000安装调试手册.pdf
- 山西省临汾市2025-2026年七年级上历史期末试卷.docx VIP
- 2025年3月电子学会青少年软件编程(scratch二级)等级考试试卷-编程题-附答案.pdf
- 2025年新疆职业大学单招笔试英语试题库含答案解析.docx VIP
- 党务培训课件.ppt VIP
原创力文档

文档评论(0)