基于R的Apriori算法在高额住院费用中的应用研究-中国卫生统计.PDFVIP

  • 10
  • 0
  • 约1.06万字
  • 约 3页
  • 2018-11-27 发布于天津
  • 举报

基于R的Apriori算法在高额住院费用中的应用研究-中国卫生统计.PDF

基于R的Apriori算法在高额住院费用中的应用研究-中国卫生统计

中国卫生统计2017年4月第34卷第2期 ·315· 基于R的Apriori算法在高额住院费用中的应用研究 △ 成都市第三人民医院信息部(610031) 郭慧敏 杜 军  黄路非   【提 要】 目的 通过Apriori算法分析高额医疗费用患者相关指标之间的关系,试图找到影响医疗费用的因素,利 用R扩展医学统计的工作思路。方法 利用R软件中的arules包对2015年某院出院的高额治疗费用患者做关联规则分 析,探索出院科室、住院天数与总费用,出院科室与性别,出院科室与药费,出院科室与有无手术的关联规则,并分析其原 因。结果 某些科室住院天数越多,费用越高;而某些科室的住院天数与费用没有太大关系;胸外、心内、神外、ICU、心外 五个病区出院的高额费用患者通常为男性;呼吸、ICU、心外、胸外、神外五个病区出院的高额费用患者的药费一般大于2 万元;心外、胸外、骨科等病区的高额医疗费用的出院患者通常要行手术治疗手段。结论 Apriori算法可以挖掘数据间内 在的关系,为临床决策提供一定的理论支持,R语言可以快捷的完成医学统计工作。 【关键词】 R语言 关联规则 高额住院费用 数据挖掘   目前新一轮医疗改革正在如火如荼的进行中,各 用、药费等字段;由于在数据分析过程中只能对离散变 方对医疗改革保持了非常高的关注度;当下,看病难、 量进行分析,故需将某些字段进行离散化处理,例如数 [1] 据挖掘需要用到是否手术字段,但是在原始数据中并 看病贵成了医患矛盾的主要集中点 ,而看病贵的一 个重要构成就是患者住院期间的医疗费用过高。高额 未提供该字段,需将获得数据中存在手术名称的标记 医疗费用患者往往为危急重症病人,其主要特点为单 为有手术,而无手术名称的记为无手术。 次花费巨大,消耗大量的医疗资源,这极易给家庭和社 2统计学方法 [10] 会造成沉重负担,部分患者难以承受巨额费用,导致因 R语言是专门为统计而设计的语言 ,R语言能 [2] 够为不同的统计功能提供多种实现途径,它是一套开 病致贫、因病返贫 。另外,高额的医疗费用也容易 造成医患关系紧张,这也是滋生医闹等现象的主要诱 源的数据分析解决方案,其完全免费,对于统计工作者 因。面对这样的境况,严控医疗费用不合理的增长成 非常友好,而且在全球有一个庞大且活跃的研究型社 [3] [11] 为亟待解决的社会问题 。 区维护 。本文主要利用 R语言中arules包中的 关联算法是一种常见的数据挖掘手段,它可以发 apriori()函数进行关联规则提取,在规则提取过程中, 现一个事物与其他事物之间的关联和相关性;在我国, 设定最小支持度为0020且最小置信度为0500为强 该方法在中医学中的应用非常广泛[4-5],在医学其他 关联规则[12],得到强关联规则后,筛选出提升度大于 领域的应用逐渐增加。本文通过整理高额医疗费用患 1的强关联规则做分析;其中R的版本为331,arules 者的病案首页信息,利用Apriori算法查找符合条件的 包的版本为14-1。 [6] 关联规则 ,以期分析高额费用患者各个指标之间的 结  果 [7] 相互关系 ,通过关联规则的关系梳理找到高额费用 [8]

文档评论(0)

1亿VIP精品文档

相关文档