- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
集成临床数据仓库的建立与应用研究.pdf
集成临床数据仓库的建立与应用研究
广州总医院 刘晓辉 李小华 杨哲 田源 陈穗芬
(广州,510010)
摘要:本文探讨数据仓库技术在医院信息化应用中的作用与意义。研究利用数据仓库技
术,挖掘和整合医院各类医疗信息系统的诊疗信息,建立集成临床数据仓库,为临床诊断、
治疗提供辅助决策的技术原理和方法。
1、 引言
我国医院信息系统(HIS )的开发和使用始于上个世纪八十年代,在经过近二十年的开
发和使用后,现正进入一个快速发展和成熟期。国内各家大型医院都已先后建立了自己的
HIS 系统。随着 HIS 的发展和成熟,以及医院 “以病人为中心”指导思想的确立,以HIS
系统为基础发展起来的、以病人为中心的临床信息系统(Clinicla Information System )开始
出现。CIS 是相对面向管理的信息系统而言的,是指以病人信息的采集、存储、展现、处理
为中心,为临床医护人员和医技科室的医疗工作服务的信息系统,它与管理信息系统之间并
无严格的界限。CIS 主要包括医生工作站系统、护理信息系统、检验信息系统(LIS )、放射
信息系统(RIS )、手术麻醉信息系统、重症监护信息系统、图像存档和通讯系统等等。CIS
具有数据量大、实时性强、模块分散、数据利用率低的特点,数据库中存储了大量未被利用
的临床数据。若要进一步挖掘临床数据,提高临床数据的利用率,有必要在目前的系统中引
入一项新技术:数据仓库技术,来实现对CIS 进行知识发现,从而让数据更好地服务于临床。
2 、 集成数据仓库建立的方法和意义
数据仓库是一种面向主题的、集成的、不可更新的、随时间的变化而不断变化的数据集
合。这样的定义包含了数据仓库的特点:一是数据仓库非常庞大,包括了不同数据源的、不
同历史时期的数据;二是数据仓库的组织形式是面向主题的。因此,从以上特点分析,数据
仓库的开发方法是不同于关系数据库的从需求开始, 以实现和维护结束的开发方法。数据仓
库的开发过程实质上是一个数据驱动的过程,是一个从主题出发,汇总数据,得出结论的不
断循环过程。将快速原型法(rapid prototyping )引入数据仓库的开发,正好符合了这样的过
程,快速原型法是近年来提出的一种以计算机为基础的系统开发方法,它首先构造一个功能
简单的原型系统,然后通过对原型系统逐步求精,不断扩充完善得到最终的系统。快速原型
法的示意图如下:
数据仓库建立的示意图如下所示:
数据仓库建立的具体步骤如下:
(1) 概念数据模型的设计
数据仓库是对现有数据库系统中的数据进行集成和重组而形成的数据集合,所以数据仓
库的概念数据模型设计,首先要对已有的数据库系统加以分析理解,了解原有数据库系统中
数据的组织、分布情况,然后在此基础上确定建立数据仓库系统的概念数据模型。
首先进行需求分析。通过需求分析,我们可以将用户的需求转变为对数据的需求,从而
划定一个当前的大致的系统边界。
然后确定主要的主题域,也就是要找出多个系统间的公共键码,多个系统间的数据联系,
以及充分代表主题的属性组,从而形成数据仓库的数据模型。
我们设计的临床决策支持系统是从临床需求出发,将病人诊疗过程中产生的各种数据进
行汇总、分析,找出治疗各种疾病的有效的临床治疗手段,从而为临床决策提供辅助决策。
通过需求分析,可以确定上述临床应用的数据需求主要是住院病人诊断治疗情况,以及所有
做过的检验、检查情况,这些数据分布在HIS、CPR 、PACS 、LIS 中。将这些数据联系起来
的公共键码主要是病人的基本信息,其中以住院号为首选,在遇到不可确定的信息时,同时
还要参考病人的其他基本信息。
(2 ) 逻辑模型设计
逻辑模型的设计主要包括对一个大主题的细化,以及粒度层次的划分和模式的确定。临
床诊疗决策支持系统是一个大主题,在初步的研究中我们设立三项主题:院内感染监测指导
系统、病人临床疗效观察分析和评估系统、病人信息数据质量监控系统,然后分别对每个主
题进行设计。粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中
保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,
粒度级就越大。由于我们采用了intersystems公司的后关系数据库Caché,所有抽取的数据
以原表的形式进行多维重建,因此粒度级别最小。
(3 ) 物理模型设计与数据
文档评论(0)