构建医疗卫生数据仓库.docxVIP

  • 6
  • 0
  • 约3.36千字
  • 约 6页
  • 2020-02-27 发布于陕西
  • 举报
构建医疗卫生数据仓库 袁烨 江苏先联信息系统有限公司,210012,南京市雨花台区郁金香路17号南京(雨花)国际软件外包园 摘?要 本文主要对医疗卫生数据仓库的架构、数据特点、实现方法和应用等方面,进行了广泛而深入的探讨。 关键词????数据仓库 Bulidingthe Data Warehouse of MedicalHealth Abstract ???????? The paper is concerned with extensive and in-depth discussion which about architecture, data characteristic, realization method and application of the data warehouse of medical health. Keywords????????Data Warehouse 1????引言 近年来,伴随着医疗数字化和区域卫生数字化的蓬勃发展,各个医疗卫生机构的数据量迅速增长,对数据处理和分析的需求越来越强。将医疗卫生数据统一、集中、建立数据仓库,不仅能用于生成医疗报表,还能够提供数据分析、辅助决策、知识挖掘等,是医疗卫生工作今后发展的方向,对于医疗卫生管理、临床治疗、医疗卫生科研、卫生事业发展等领域都有巨大的推动作用和里程碑式的意义。 2????数据仓库的架构 医疗卫生数据来源于各个业务系统、人工统计和相关行业等,在同一种业务系统里,会出现不同厂商、不同时期的各种版本,数据离散杂乱,数据总量非常大。数据仓库首先通过数据总线,将业务系统和文件的数据按照相关规范交换进数据中心,这个数据规范既参考了国际卫生信息交换标准(HL7),又结合了卫生部颁发的数据集规范,和数据中心对主数据的管理一起,保证了进入数据中心的数据的规范性、完整性和一致性(见图1)。 图1:数据仓库架构图 数据在数据中心规范化、整理后,通过ETL平台的抽取、转换、加载进入数据仓库。数据仓库中的数据不再是业务流程数据,而是对一个个事实的描述,以及对维度的定义。再根据分析或挖掘的不同主题,建立相对应的数据集市,将数据ETL到数据集市中。数据集市中的数据,高度汇总又包含有各个维度,非常适合于多维报表查询、辅助决策及分析挖掘。最后,由统一的门户进行查询访问。 3????医疗数据仓库的特点 医疗卫生的数据不同于一般数据仓库数据,包含如下四个特点: 多样性:从医患交流、医学影像、检测结果中获取的医学数据,表现形式具有多样性,比如:文本形式(如主诉、现/往病史、过敏史、病程、检测报告等)、图表形式(如体温的记录表、心电图、CT等)、影像形式(如X光片、超声心动图等)等。 隐私性:医疗卫生数据不可避免地涉及到患者个人的隐私信息,这些数据将会涉及到法律、伦理道德、社会和心理等因素,有信息安全隐患。 不完整性:大量数据来源于人工记录,导致数据记录的偏差和残缺,许多数据的表达、记录本身也具有不确定性,病例和病案尤为突出。 冗余性:医疗卫生数据是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含重复的、无关紧要的、甚至是相互矛盾的记录。 4????数据仓库的建立 在明确了医疗卫生数据仓库的架构和数据特点后,我们就着手建立数据仓库,共分为如下四个步骤。 4.1.元数据管理 数据是整个数据仓库的基础,医疗卫生的数据源很复杂,数据项又非常多,手工维护起来非常麻烦,需要有一个平台统一管理,来保证数据的正确性。元数据管理平台,就是用来管理数据的平台,在这个平台上,我们通过综合考虑国际卫生信息交换标准(HL7)、卫生部颁发的数据集规范以及数据上传交换的具体实现,定义了数据中心所有对象的结构和字典的取值范围(见图2)。 图2:元数据管理平台 然后,通过数据总线,我们要将各个业务系统的数据,上传进数据中心。这个上传的步骤不光要定义系统的接口、数据的规范化、代码值的规范化,还需要主数据的统一,比如人的信息,在不同系统中的可能代码不同,但是数据中心里要使用统一的ID。 4.2.主题划分 数据仓库是面向主题的,是在高层次上对医疗卫生海量信息进行综合、归类、分析和提取。各个主题所涉及的数据,以及数据之间的联系,进过有效的组织,形成一个个完整的分析领域,即主题域。 我们将医疗卫生信息划分为以下几个主题域:卫生资源主题域、医疗服务主题域、公共卫生主题域、药物管理主题域等(见图3)。 图3:主题划分 主题域需要具有独立性和完备性,独立性是指主题域必须具有独立内涵,有明确的界限;完备性是指,能够在一主题域内找到分析所要求的一切数据,如果涉及到主题之外的数据,那么就应当将这些数据增加到该主题中来,从而完善该主题。 4.3.模型搭建 在需求分析层面,我们划分好了主题域,确定了每个主题域的

文档评论(0)

1亿VIP精品文档

相关文档