数据挖掘与医院管理统计.ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
◎引导IT模式向IR模式转变 ◎加强卫生信息资源体系建设 ◎促进卫生信息标准体系建设 ◎深入开展数字化医院信息资源开发研究 多水平模型(multilevel model)是20世纪70年代发展起来的处理具有层次结构特征数据的一种多元统计方法。 该方法考虑了数据误差的层次性,可将传统模型中的随机误差项分解到与数据层次结构相应的水平上,使得个体水平的随机误差更纯,回归系数的估计更加有效。 优点: 能够有效处理传统多元统计方法难以分析的具有层次结构特征的数据; 可同时分析高水平和低水平的数据,检验微观和宏观变量的效应; 无需假设数据中的观测相互独立,可修正观察数据的非独立而引起的参数标准误估计偏倚; 可以研究结局测量在个体水平和组群水平相对变异的情况。 数据现状 数 据 环 境 面向统计专业人员的信息应用平台 历史数据 在线调用 高 端 产 品 纵向、横向结构、外部 专题分析 信息服务 非定制输出 OLAP工具 关联与比较 电子台帐 多维分析-信息服务 数据挖掘-知识服务 可操作 语义环境 定制输出 多条件查询 任意区间报表 9.数据分析平台 二、数据挖掘示例 (三)中国重大疾病临床诊疗知识库 二、数据挖掘示例 (二)中国重大疾病临床诊疗知识库 二、数据挖掘示例 二、知识库应用服务设计与研发 (二)中国重大疾病临床诊疗知识库 二、数据挖掘示例 病种筛选 主条件 由病人出院第一诊断确定 四级病种分类体系 分类显示疾病名称、ICD10编码 支持模糊检索 二、数据挖掘示例 二、数据挖掘示例 二、数据挖掘示例 二、数据挖掘示例 数据挖掘与医院管理统计 一、数据挖掘的意义 二、数据挖掘示例 三、数据挖掘方法简介 四、医院管理统计特点 医疗卫生信息数据的特点 内容 临床干预研究 (理想世界) 医疗卫生观察性研究 (真实世界) 来源 严格设计的研究 日常工作所得 设计 干预,严格随机、对照、盲法试验。严格控制混杂和偏倚 客观观察,存在混杂和偏倚。横断面、病例对照、队列研究 样本量 通常较小 通常较大 目的 针对某种疾病,进行临床治疗方案、用药等的选择 医疗卫生政策制定、工作指导、决策依据 三、数据挖掘方法简介 医疗卫生大数据的分析策略 数据的特征描述 分析比较 深层挖掘 统计表 统计图 统计指标 基本统计方法 多元统计方法 数据挖掘新方法 三、数据挖掘方法简介 探索结局的多种潜在影响因素 多重线性回归、logistic回归等,生存分析等 综合多个指标进行事物的分类或判别 判别分析,决策树,随机森林等 多指标的降维及潜在因素的探索 主成分分析、因子分析、聚类分析等 预测发展趋势 指数平滑法、ARIMA预测方法 ,时间序列分析等 多种混杂因素控制 倾向性评分、工具变量、边缘结构模型等 三、数据挖掘方法简介 发现医疗卫生服务数据中隐含的问题 采用适合的数据挖掘方法 得出准确结论,做出正确决策 三、数据挖掘方法简介 问题 方法 决策 问题一 混杂偏倚的影响。 时依性混杂因素的影响。 层次结构数据的分析。 问题二 问题三 问题四 遗漏或难以测量的混杂因素。 三、数据挖掘方法简介 问题一 混杂偏倚是影响结果真实性的主要问题。 如何控制观察性研究中非随机化分组组间的混杂偏倚? 如: 在电子病历数据的分析中,由于未经过随机化分组,不同治疗方案的患者在病情、年龄、性别构成、基础指标、伴随疾病等各个方面差异较大,混杂因素过多,因此在研究不同治疗方式对于治疗结果的影响时,需要用特殊的统计学方法减少这些混杂因素引起的偏倚。 三、数据挖掘方法简介 倾向性评分法(Propensity Score) 一种处理非随机对照研究中混杂偏倚的有力工具,由Rosenbaum和Rubin在1983年首次提出。用于均衡实验组和对照组之间协变量分布不均的一种方法。 思想:根据倾向评分值进行不同对比组间的匹配或分层,使得对比组间混杂因素的分布达到均衡。 倾向性评分法 二、数据挖掘方法简介 优点: 将所有混杂因素(即协变量)用一个倾向评分值来表示 ,降低了协变量的维度。 在大样本情况下,经过倾向评分调整的组间个体,除了分组变量和结局变量分布不同外,其他协变量应当均衡可比,相当于“事后随机化”。 倾向性评分法 三、数据挖掘方法简介 问题二 观察性研究由于未对研究对象随机分组,混杂因素在组间分布不均衡。但在实际研究中往往难以采集到所有的混杂因素,从而使估计结果发生偏倚。 遗漏或难以测量混杂因素 如:在一次流行病学调查中,评估流感疫苗接种对人群死亡率的影响, 可测量的混杂因素:性别、年龄、接种是否收费等。 遗漏/难以测量的混杂因素:流感的易感性、社区疫苗接

文档评论(0)

宝贝计划 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档