医院-数据仓库的设计心得.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医院-数据仓库的设计心得

医院数据仓库的设计心得 曲阜市人民医院 孔敏 摘要:数据仓库是为数据分析而设计的开发工具,使用OLAP工具进行联机分析处理。本文叙述了曲阜市人民医院的数据仓库的设计和开发过程,介绍了数据仓库在医疗工作中的应用以及如何从数据库中抽取有用信息,为领导决策、医院运行监控、绩效评估等业务系统的运行提供数据环境。 关键字:数据仓库;多维数据集,数据分析 我院从1995年开始使用HIS系统,到目前已经积累了上万条的门诊与住院病人信息记录。为了从中挖掘有用信息,我院进行了信息系统数据仓库建设,对本次的设计与实施的过程特写此文供同行们参考。 首先我们先了解一下数据仓库与数据挖掘方面的知识。 数据仓库:目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。 数据挖掘:数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。数据挖掘为探查和分析新的数据类型以及用新方法分析旧有数据类型提供了令人振奋的有用信息。数据挖掘的意义是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型数据库,发现先前未知的有用模式。数据挖掘还具有预测未来观测结果的能力,并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,则是信息检索领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。 理解了数据仓库与数据挖掘的含义后,我们才能开始下面的具体实施步骤 开发联机分析系统的第一步是需求分析。因缺乏数据在线分析实践,故难以进行有效的需求调研。我们一开始是从医疗统计出发,确定的目标是:(1). 要满足“医院评审标准”、“医院医疗费用统计的有关规定”和卫生行政部门要求的常规报表和统计的规定;(2).制定医院HIS数据库的扩充统计信息;3. 根据病种和治疗的特点,建立新的统计单位和指标。 2. 联机分析的基础是医疗HIS的有关数据,第二步进行的是数据源分析。曲阜市人民医院是一家有近七百张病床的二级甲等综合性医院,有10多年的应用HIS系统管理经验。其主要的 HIS 数据源有:门诊挂号信息,病人住院信息,门诊和住院费用明细,药品管理信息,及其它辅助信息。表中数据包含了:(a)病人信息和疾病属性;(b)门诊住院治疗时间、单位、医生;(c)疗效;(d)医疗业务收入;(e)各项检查、治疗、护理项目的名称、数量、时间和费用;(f)药品及耗材。 3. 制定多维数据集。根据数据源分析,我们定义了病人、门诊、住院和费用四个多维数据集,原数据库中具有统计意义的字段统统被定义为维度或量度。 4.制定新的统计单位和指标。HIS系统中最复杂的数据是住院治疗费用。它们在数据库中按照“住院号(关键字)-关联-相关费用明细”的结构组织存储。这种结构产生以住院号为单位的统计指标:年度出院人次数、平均住院日、平均住院费用和治愈率。对于综合性的医院,不能正确地反映疾病和治疗与疗效和费用间的关系,也缺乏横向、纵向的可比性。因此统计的工作量、疗效、费用的单位应该是实际病人数和汇总后的治疗次数,而不是住院次数。我们比较了我院指标的具体数值,发现10多年来住院病人的平均费用有所下降,而人均年费用却不变或略增。显然前者是假象,只不过将整个治疗过程分为多一些的住院次而已。可见新指标具有较好的统计价值。 5. 确定数据结构。新指标需要增加统计后的实际病人信息和治疗维度。 根据上述多维数据集,按照各维度的各种合理组合,建立了病人特征、医疗收入、门诊数据、住院数据、费用疗效、潜在问题、药品和耗材等主题组,定制数据仓库的固定主题。从数据仓库的角度看,统计量就是病人、工作量、疗效和费用等度量, 统计指标就是这些度量在规定维度下的成员属性,报表就是指定两个或多个维度下统计量或统计指标的交叉表。通过多维数据集可以使管理者们既能评审结局,也能分析过程;从而判断现象背后可能的业务趋势、潜在的利益或问题。 数据仓库建设完毕后,还要进一步规范数据的

文档评论(0)

a888118a + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档