- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学信息2008年12月第2l卷第 12期 MedicalInformation.Dec.2008.V01.21.No.12
通过对糖尿病患者的年龄、性别等一般情况、手术及治 人工神经网络模型除了可以完成分类任务之外,还可以
疗情况多个方面的分析,预测糖尿病住院费用,一般情况下 完成更为复杂的费用预测。它与决策树方法结合起来可用于
选用多元线性回归。将住院费用作为因变量 ,量化后的可能 从相关性不强的多变量中选出重要变量,可以使所建模型效
特征字段作为 自变量 ,进行多元逐步回归分析,筛选住院费 果更好;与Logistic回归结合,后者能为前者的预测方法提供
用的影响因素。 简洁的输入变量,提高网络的收敛速度。
如果要分析费用是否会超过某个警戒线的概率大小或
是预测糖尿病各种发症概率,可选择 Logistic回归进行变量 5评估与结论
分析。在Logistic回归模型中,采用最大似然法估计出模型的 在建模结果评估阶段,需要对效果较差的结果需要分析
系数,估算系数时需要采用迭代计算。 原因,有时还需要返回到前面的步骤对挖掘过程重新定义。
4.2决策树 数据挖掘建模的目的是为了达到决策 目的,得出有用的结
应用决策树技术,可以为预测总费用提供参考。生成决 论 ,例如,通过挖掘发现糖尿病患者住院期间检查费用与药
策树时,以”人院病情”为分类属性(入院病情分为:危、急、一 品费用比例偏大,也就是说 ,检查费占住院费比例大 ;进一
般),采用C4.5算法 ,此算法倾向于使用能把数据分区成有 步 ,将发现这并不是医院为了盈利而无故增加的项 目,而是
低类熵的子集的属性,即大部分样本都属于一个单独的类。 由于糖尿病并发症需要进行跟踪检查引起的;此外,总预付
利用生成的决策树 ,参考各类别所占比例和中位数费用 ,总 费用的公式为制定更为合理的单病种医疗消耗标准提供了
预付费用c的计算公式可如下形式 : 参考。
n 参考文献 :
C=Eo,iXi,(i_l,2,…n) 1『]Mel4medKantardzic.数据挖掘一概念 、模型、方法和算法.北京:清
i_1 华大学出版社,2004.3.
2【]李戈.基于数据挖掘技术预测2型糖尿病慢性并发症.硕士研究生
其中,∞为第 i类所占的比例 ,x为模型中第 i类的中 学位论文,2004.5.
[3】侯晓智.基于数据挖掘技术的上海市肝胆肿瘤病例住院费用研究.
位数费用,n为模型分类的个数3【1。
硕士研究生学位论文,2004.4.
4-3人工神经网络
编辑 壬鸿兰
市民健康信息系统数据质量的监控与管理
王继伟 ,杨毕辉 ,胡素芳
(解放军第一七 四医院,福建 厦 门 361003)
摘要 :提供”及时、准确、完整t·的信息服务是信息系统成功应用的一个重要指标。针对市民健康信息系统应用 中存在 的数据质
量问题 ,阐述 了为满足”及 时、准确、完整”这一要求在系统应用中主要思路与做法 ,并实现 了市民健康信 息系统的成功应用。
关键词 :健康信息系统;数据质量;监控与管理
收稿 日期:2008—08—02
本项 目为国家科技支撑计划课题”军民协同共建医疗服务示范工程”,编号为:2006
文档评论(0)