数据挖掘与医院管理统计.ppt

下载文档 降价啦

60
0
约1.44万字
约 85页
2016-11-15 发布于湖北
举报
版权申诉
保障服务

数据挖掘与医院管理统计.ppt

1、本文档共85页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

◎引导IT模式向IR模式转变 ◎加强卫生信息资源体系建设 ◎促进卫生信息标准体系建设 ◎深入开展数字化医院信息资源开发研究多水平模型(multilevel model)是20世纪70年代发展起来的处理具有层次结构特征数据的一种多元统计方法。该方法考虑了数据误差的层次性，可将传统模型中的随机误差项分解到与数据层次结构相应的水平上，使得个体水平的随机误差更纯，回归系数的估计更加有效。优点：能够有效处理传统多元统计方法难以分析的具有层次结构特征的数据；可同时分析高水平和低水平的数据，检验微观和宏观变量的效应；无需假设数据中的观测相互独立，可修正观察数据的非独立而引起的参数标准误估计偏倚；可以研究结局测量在个体水平和组群水平相对变异的情况。数据现状数据环境面向统计专业人员的信息应用平台历史数据在线调用高端产品纵向、横向结构、外部专题分析信息服务非定制输出 OLAP工具关联与比较电子台帐多维分析-信息服务数据挖掘-知识服务可操作语义环境定制输出多条件查询任意区间报表 9.数据分析平台二、数据挖掘示例（三）中国重大疾病临床诊疗知识库二、数据挖掘示例（二）中国重大疾病临床诊疗知识库二、数据挖掘示例二、知识库应用服务设计与研发（二）中国重大疾病临床诊疗知识库二、数据挖掘示例病种筛选主条件由病人出院第一诊断确定四级病种分类体系分类显示疾病名称、ICD10编码支持模糊检索二、数据挖掘示例二、数据挖掘示例二、数据挖掘示例二、数据挖掘示例数据挖掘与医院管理统计一、数据挖掘的意义二、数据挖掘示例三、数据挖掘方法简介四、医院管理统计特点医疗卫生信息数据的特点内容临床干预研究（理想世界）医疗卫生观察性研究（真实世界）来源严格设计的研究日常工作所得设计干预，严格随机、对照、盲法试验。严格控制混杂和偏倚客观观察，存在混杂和偏倚。横断面、病例对照、队列研究样本量通常较小通常较大目的针对某种疾病，进行临床治疗方案、用药等的选择医疗卫生政策制定、工作指导、决策依据三、数据挖掘方法简介医疗卫生大数据的分析策略数据的特征描述分析比较深层挖掘统计表统计图统计指标基本统计方法多元统计方法数据挖掘新方法三、数据挖掘方法简介探索结局的多种潜在影响因素多重线性回归、logistic回归等，生存分析等综合多个指标进行事物的分类或判别判别分析，决策树，随机森林等多指标的降维及潜在因素的探索主成分分析、因子分析、聚类分析等预测发展趋势指数平滑法、ARIMA预测方法，时间序列分析等多种混杂因素控制倾向性评分、工具变量、边缘结构模型等三、数据挖掘方法简介发现医疗卫生服务数据中隐含的问题采用适合的数据挖掘方法得出准确结论，做出正确决策三、数据挖掘方法简介问题方法决策问题一混杂偏倚的影响。时依性混杂因素的影响。层次结构数据的分析。问题二问题三问题四遗漏或难以测量的混杂因素。三、数据挖掘方法简介问题一混杂偏倚是影响结果真实性的主要问题。如何控制观察性研究中非随机化分组组间的混杂偏倚？如：在电子病历数据的分析中，由于未经过随机化分组，不同治疗方案的患者在病情、年龄、性别构成、基础指标、伴随疾病等各个方面差异较大，混杂因素过多，因此在研究不同治疗方式对于治疗结果的影响时，需要用特殊的统计学方法减少这些混杂因素引起的偏倚。三、数据挖掘方法简介倾向性评分法（Propensity Score）一种处理非随机对照研究中混杂偏倚的有力工具，由Rosenbaum和Rubin在1983年首次提出。用于均衡实验组和对照组之间协变量分布不均的一种方法。思想：根据倾向评分值进行不同对比组间的匹配或分层，使得对比组间混杂因素的分布达到均衡。倾向性评分法二、数据挖掘方法简介优点：将所有混杂因素（即协变量）用一个倾向评分值来表示，降低了协变量的维度。在大样本情况下，经过倾向评分调整的组间个体，除了分组变量和结局变量分布不同外，其他协变量应当均衡可比，相当于“事后随机化”。倾向性评分法三、数据挖掘方法简介问题二观察性研究由于未对研究对象随机分组，混杂因素在组间分布不均衡。但在实际研究中往往难以采集到所有的混杂因素，从而使估计结果发生偏倚。遗漏或难以测量混杂因素如：在一次流行病学调查中，评估流感疫苗接种对人群死亡率的影响，可测量的混杂因素：性别、年龄、接种是否收费等。遗漏/难以测量的混杂因素：流感的易感性、社区疫苗接