- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
医院临床、运营和科研大数据平台的基础架构方案
?
?
应用需求决定平台架构,平台架构决定基础架构。三甲医院大数据应用场景主要分成临床、运营、科研三大类,分别对应临床数据中心(CDR),运营数据中心(ODR)和科研数据中心(RDR),临床数据以电子病历为核心,目前随着结构化电子病历的普及,纯文本的数据越来越少,NLP的技术依然适合,运营数据则大多数为结构化数据,科研数据则在临床数据的基础上有更多的多媒体数据(多数为影像数据)、实验数据和随访数据。大数据平台基础架构设计需要支撑上述需求的实现,计算能力、存储能力和安全是基础架构建设的三个重要方面。计算能力主要在数据采集、预处理、实时计算和分析阶段进行支持。存储能力则是支持分析数据所需要存储资源和存储空间的支持。三甲医院大数据平台大多数基于Hadoop等分布式平台,采用内存数据库或图数据库进行数据存储。
为帮助三甲医院用户更好地建设大数据平台基础架构,twt社区上个星期组织了“三甲医院如何建设支持临床、运营和科研大数据平台的基础架构?”线上同行交流活动,特别邀请到自三甲医院的专家、戴尔科技医疗行业专家与医院同行一起交流分享,现将从四个角度出发的交流内容总结如下,供更多同行参考,包括:基于临床、运营和科研大数据平台的内容和要求角度、基于医院大数据平台建设的技术架构角度、基于大数据平台建设标准和目标角度、基于大数据的存储规划角度,以及交流达成的共识总结。
交流达成的共识总结
通过本场医院同行的交流活动达成了一些交流共识如下,仅供参考:
(1)从大数据平台建设内容方面来说,医院大数据平台围绕临床、运营以及科研等三个主要层面进行,新技术,新手段也都需要围绕这三个方面,因此,CDR、ODR、RDR的建设应该说是囊括了医院信息化大数据平台的主要内容。
(2)从技术架构角度来说,基于分布式存储的架构平台似乎成为主流,但是目前正在逐步从分布式过渡到云,主要以医院的私有云+公有云的混合模式出现。
(3)从建设标准和目标角度,大数据平台应具有异构数据的标准化,数据处理流程,分析过程标准化的功能,同时,数据可视化也应是目标之一。
(4)从数据存存储选型角度,混合SSD和传统SATA的存储器搭建SAN网络是一种路线,分布式存储的效果主要体现在不少医院早些年建成的基于Hadoop架构。从科研平台未来的发展看,采用支持Hadoop的分布式存储,实现计算与存储的分离,是未来的一个趋势。
一、基于临床、运营和科研大数据平台的内容和要求角度
1、三甲医院大数据平台如何建设,才能满足具有多模态,异构化,海量化的临床、运营以及科研数据的整合?
【问题描述】众所周知,三级医院经过十几年、几十年的信息化建设,已经建设成为具有临床数据支撑,科研支撑,以及运营支撑的全方位信息化应用的场景,但是随着大数据分析广泛应用,海量数据的整合挖掘及再利用也提上日程,部分医院走在了前列,但是在开展的过程中遇到了不少问题,比如,数据的模式的多样性造成了对数据使用的难点。医疗数据中包含了文本,图像,视频等,还有不同模式的数据。如何将这些数据整合利用,以便发挥数据的最大利用价值成为目前医疗大数据平台的研究方向之一?
@zyp8365广东省中医院?高级工程师:
数据的多模态、异构化、海量化必然导致其支撑架构的多样性。哪些数据适合关系型数据库,哪些数据适合分布式数据库,存储的选择亦是如此,也要结合数据类型,数据的重要性、时效性要求以及业务的实际要求等因素综合考虑。数据的整合利用离不开如下几个方面的工作:
1、大数据平台需求与多元化采集数据源的梳理;
2、数据的标准化规范化治理;
3、数据的主题化的汇聚;
4、数据的知识化社会化的应用。
@spgoall和祐国际医院?信息管理部部长:
可以考虑先建立数据湖,把数据整合后,再按主题做筛选和清洗。
@Hunter123戴尔科技?医疗行业解决方案架构师:
医疗数据的来源和类型都非常的丰富,一般来讲至少包含了HIS、EMR、LIS、RIS、人事系统、随访系统、手麻、护理等等各个业务平台,数据类型包含结构化数据、非结构化文本、图片、甚至有的会包括一些多媒体数据,而这些数据的复制、导入都有各自的方式。所以在大数据平台的建设中,除了数据量的考量,还需要充分考虑到对多样化数据的集成问题,需要支持丰富的数据访问接口,以减少对数据集成带来的困难。同时在使用这些数据时,首先需要遵循国内、国际的相关标准,进行数据治理和标准化,然后将标准化后的数据按照不同场景进行计算整合,提供给业务使用。
2、信息部门该如何规划CDR、ODR、RDR的裸金层?
【问题描述】当前建设CDR、ODR、RDR数据中心是医疗圈热门的话题,信息部门该如何规划CDR、ODR、RDR的裸金层,一次把基础架构搭建立起来,避免重复建设?
文档评论(0)