决策树算法在病例组合费用测算中应用研究.docVIP

下载本文档

5
0
约3.79千字
约 8页
2018-06-25 发布于福建
举报
版权申诉

决策树算法在病例组合费用测算中应用研究.doc

此“医疗卫生”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

决策树算法在病例组合费用测算中应用研究

决策树算法在病例组合费用测算中应用研究　　摘要：本文以宁波地区某三甲及某骨科专科医院2010年1月1日～2011年12月30日费用及病案信息数据为基础，利用SPSS18.0对数据进行分析腰椎间盘脱出疾病的费用影响因素进行分析，并以费用为目标变量，运用决策树CHAID算法对此疾病进行病例组合费用测算。结果表明，基于CHAID的病例组合费用合理有效，6个组合病例组费用组合内有同质性，而组间有异质性。测算的标准费用为用实际费用的90.2%。为进一步完善病例组合，必须与临床路径相配套，进一步原始数据的采集与质量，从而为医疗机构以及政府部门开展按病种医疗费用支付方式提供参考。　　关键词：CHAID；病例组合　　随着社会经济和医学技术的发展，人口老龄化问题的加剧，以及疾病谱和死因谱的改变，人民对医疗卫生服务需求在不断提高，医疗费用的过快增长已经成为政府面临的严重问题。近年来我国GDP一直保持9.8%的年平均增长率，但卫生总费用却以17.1%的年平均增长率持续增长。人均医疗费用的增长幅度远远大于人均收入增长幅度，国民医疗负担沉重。合理控制医疗费用己成为我国医疗卫生体制改革面临的重点和难点问题。国外社会医疗保险的实践经验已经充分证明，按病例组合医疗费用支付方式对于医疗服务供方的医疗行为以及医疗费用的控制会产生明显的导向作用。相对于其他方式，它既能保证医学高新技术的发展，持续促进医疗服务质量、提高医疗工作效率，又能控制医疗成本、降低医疗费用。本次研究试图对在宁波地区较有代表性的某三甲医院及骨科专科医院腰椎间盘脱出疾病的费用影响因素进行分析，并以费用为目标变量，运用决策树CHAID算法对此疾病进行病例组合分类，并确定分组结果合理性，探讨方法适用性，为医疗机构以及政府部门开展按病种医疗费用支付方式提供参考。　　1资料与方法　　1.1一般资料以浙江省宁波市某三甲医院及骨科专科作为调查对象，两家医院骨骼系统疾病技术力量较强，具有一定的区域代表性。在具体研究对象的选择上，主要选取2010～2011年间2院代表性较强、住院人次较多、诊断明确、治疗有效、易于分析且具有一定费用下降空间的腰椎间??突出（ICD-10编码）疾病出院病例。在内容上则以病案首页信息为依据，摘录每例病例的住院总费用、实际住院天数、是否手术、医疗保险支付方式以及相关人口学信息。　　1.2方法　　1.2.1决策树CHAID算法基本概念决策树算法是通过一系列if-then的逻辑分支关系，形成一套分层规则，将所有可能发生的结局概率分布用树形表达。其包括决策节点、机会结点和结局结点。从决策结点引出一些射线，表示不同的备选方案。从机会结点引出的射线表示该结点可能发生的各种随机事件。CHAID算法核心思想是更具给定的反应变量以及经过筛选的解释变量对样本进行最优分割，按照方差检验的显著性进行多元列联表的自动判断分组。由于医疗费用为典型的偏态分布资料，运用CHAID可以很好的解决分析方法的适用性问题。　　1.2.2 CHAID决策树分裂生长过程　　1.2.2.1定义1 设信息源X的符号取值集合为A={a1，a2，…，an}，其中ai∈A出现的概率为pi=P[X=ai]，称I（ai）=-logPi为ai的信息量。信息量的数学期望值为信息熵，记为H（X），有H（X）=-■PilogPi决策树分类利用信息量增加作为特征选择的指标。信息增益衡量每个属性对分裂后子集的信息量贡献。　　1.2.2.2定义2 设集T包含n个样本，这些样本又分别属于m个类，其中第i个类在T中出现的比例为Pi，那么信息熵为I（T）=-■-PilogPi 　　假设属性A把集合T划分成V个子集{T1，T2，…，Tv}，其中Ti所包含的样本数为ni，那么划分后的熵就是E（A）=■■I（Ti），分裂后的信息熵为Gain（A）=I（T）-E（A）。　　逐一计算每种属性变量的信息熵，选择信息量最大的属性为分裂属性变量，完成决策树分类过程。当分裂属性为分类变量时，直接生成相关子结点。当为连续变量时，首先根据该分裂属性对此结点数据集进行聚类分析，分成几个不同的类，划分成几个相连的区间。　　为了使模型达到简约而精准的效果，根据树的生成层数、分裂聚合阈值、结点占样本比例设定父结点最少为100条，子结点为50条。　　1.3研究步骤与统计分析利用多重线性回归模型对影响出院病例住院费用的显著性因素进行筛选，确定分类结点。以住院费用为组合核心，利用CHAID算法确定病例组合方案。计算个组合的住院费用的均数、中位数以及CV（变异系数）值，并计算各层中的方差统计量。　　1.4统计学分析在统计时用采用Excel2007进行前期数据清理与洗脱，用带有决策树模块的SPSS18.0对数据进行统计分析。　　2