- 6
- 0
- 约3.36千字
- 约 6页
- 2020-02-27 发布于陕西
- 举报
构建医疗卫生数据仓库
袁烨
江苏先联信息系统有限公司,210012,南京市雨花台区郁金香路17号南京(雨花)国际软件外包园
摘?要
本文主要对医疗卫生数据仓库的架构、数据特点、实现方法和应用等方面,进行了广泛而深入的探讨。
关键词????数据仓库
Bulidingthe Data Warehouse of MedicalHealth
Abstract
???????? The paper is concerned with extensive and in-depth discussion which about architecture, data characteristic, realization method and application of the data warehouse of medical health.
Keywords????????Data Warehouse
1????引言
近年来,伴随着医疗数字化和区域卫生数字化的蓬勃发展,各个医疗卫生机构的数据量迅速增长,对数据处理和分析的需求越来越强。将医疗卫生数据统一、集中、建立数据仓库,不仅能用于生成医疗报表,还能够提供数据分析、辅助决策、知识挖掘等,是医疗卫生工作今后发展的方向,对于医疗卫生管理、临床治疗、医疗卫生科研、卫生事业发展等领域都有巨大的推动作用和里程碑式的意义。
2????数据仓库的架构
医疗卫生数据来源于各个业务系统、人工统计和相关行业等,在同一种业务系统里,会出现不同厂商、不同时期的各种版本,数据离散杂乱,数据总量非常大。数据仓库首先通过数据总线,将业务系统和文件的数据按照相关规范交换进数据中心,这个数据规范既参考了国际卫生信息交换标准(HL7),又结合了卫生部颁发的数据集规范,和数据中心对主数据的管理一起,保证了进入数据中心的数据的规范性、完整性和一致性(见图1)。
图1:数据仓库架构图
数据在数据中心规范化、整理后,通过ETL平台的抽取、转换、加载进入数据仓库。数据仓库中的数据不再是业务流程数据,而是对一个个事实的描述,以及对维度的定义。再根据分析或挖掘的不同主题,建立相对应的数据集市,将数据ETL到数据集市中。数据集市中的数据,高度汇总又包含有各个维度,非常适合于多维报表查询、辅助决策及分析挖掘。最后,由统一的门户进行查询访问。
3????医疗数据仓库的特点
医疗卫生的数据不同于一般数据仓库数据,包含如下四个特点:
多样性:从医患交流、医学影像、检测结果中获取的医学数据,表现形式具有多样性,比如:文本形式(如主诉、现/往病史、过敏史、病程、检测报告等)、图表形式(如体温的记录表、心电图、CT等)、影像形式(如X光片、超声心动图等)等。
隐私性:医疗卫生数据不可避免地涉及到患者个人的隐私信息,这些数据将会涉及到法律、伦理道德、社会和心理等因素,有信息安全隐患。
不完整性:大量数据来源于人工记录,导致数据记录的偏差和残缺,许多数据的表达、记录本身也具有不确定性,病例和病案尤为突出。
冗余性:医疗卫生数据是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含重复的、无关紧要的、甚至是相互矛盾的记录。
4????数据仓库的建立
在明确了医疗卫生数据仓库的架构和数据特点后,我们就着手建立数据仓库,共分为如下四个步骤。
4.1.元数据管理
数据是整个数据仓库的基础,医疗卫生的数据源很复杂,数据项又非常多,手工维护起来非常麻烦,需要有一个平台统一管理,来保证数据的正确性。元数据管理平台,就是用来管理数据的平台,在这个平台上,我们通过综合考虑国际卫生信息交换标准(HL7)、卫生部颁发的数据集规范以及数据上传交换的具体实现,定义了数据中心所有对象的结构和字典的取值范围(见图2)。
图2:元数据管理平台
然后,通过数据总线,我们要将各个业务系统的数据,上传进数据中心。这个上传的步骤不光要定义系统的接口、数据的规范化、代码值的规范化,还需要主数据的统一,比如人的信息,在不同系统中的可能代码不同,但是数据中心里要使用统一的ID。
4.2.主题划分
数据仓库是面向主题的,是在高层次上对医疗卫生海量信息进行综合、归类、分析和提取。各个主题所涉及的数据,以及数据之间的联系,进过有效的组织,形成一个个完整的分析领域,即主题域。
我们将医疗卫生信息划分为以下几个主题域:卫生资源主题域、医疗服务主题域、公共卫生主题域、药物管理主题域等(见图3)。
图3:主题划分
主题域需要具有独立性和完备性,独立性是指主题域必须具有独立内涵,有明确的界限;完备性是指,能够在一主题域内找到分析所要求的一切数据,如果涉及到主题之外的数据,那么就应当将这些数据增加到该主题中来,从而完善该主题。
4.3.模型搭建
在需求分析层面,我们划分好了主题域,确定了每个主题域的
您可能关注的文档
- 高值耗材追溯管理系统.ppt
- 高值易耗基本功能描述.doc
- 高植耗材条码管理追溯系统.doc
- 个人健康评估问卷.doc
- 各部位MRI检查操作常规.doc
- 工程实施体会.doc
- 功能特点介绍(八、统计分析、管理助手)gxr.ppt
- 功能特点介绍(二、条码技术、高效可靠)gxr.ppt
- 功能特点介绍(九、质量控制、专业使用)gxr.ppt
- 功能特点介绍(六、各种报告、美观整洁)gxr.ppt
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
最近下载
- 第六章 《中国的地理差异》 课件 2025人教版地理八年级下册.ppt
- 2025至未来5年中国无刷电机控制器市场数据分析及竞争策略研究报告.docx
- 2025中央民族大学教学科研人员招聘3人笔试参考试题附答案解析.docx VIP
- 2023年湖北省高考数学试卷真题(含答案详解).pdf
- IATF16949汽车认证方案获得并保持IATF认可的规则 第六版-A1(1).pdf VIP
- 园林生态学教学课件电子教案全套课件.pptx
- AIGC驱动的室内设计课程项目化教学.docx VIP
- DB46_T 692-2025 避寒旅游目的地气候资源评价技术规范.docx VIP
- DB37_T 4904-2025 链式切割水泥土连续墙技术规程.docx VIP
- 2023年湛江雷州市公安局招聘警务辅助人员考试真题及答案.docx VIP
原创力文档

文档评论(0)