对医疗大数据的认识.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

重庆大学研究生文献综述

对医疗大数据的认识

姓名:

学号:指导教师:专业:

重庆大学光电工程学院

二O一六年十一月

PAGE

PAGE3

医疗大数据产生的背景

在任何一个初具规模的医院,每天接待上万的患者前来就诊,患者的基本信息、影像信息与其他特殊诊疗信息汇集在一起是一个庞大的数据。据统计,上海市区域医疗信息平台(上海市“医联工程”及县区卫生数据中心)已经积累了覆盖3900万人群、1400TB数据量的电子诊疗与健康档案等医疗卫生数据(涵盖了全市38家三级医院3900万就诊人群的医疗信息,包括患者基本信息、就诊信息、健康档案、检验及影像检查报告、医学影像图像文件、住院相关病历、医保结算等医疗卫生数据,涉及就诊记录2.1亿条,处方记录9.1亿条)。

日积月累,这个数据量将会持续快速增长,为医院的数据存储、集成、调用等应用带来巨大压力。除了数据规模巨大之外,医疗行业的数据类型和结构极其复杂,如PACS影像、B超、病例分析等业务产生的非结构化数据,这些数据存储复杂,并且对传统的处理方法和技术带来巨大挑战【1】。医疗大数据得到人们的关注,并渴望有一种新的技术可以从这些看似杂乱无章的数据中得到价值。目前,为了提高人们的健康水平以及医疗水平,医疗行业在大数据环境下的各个领域异常活跃[2]。

医疗大数据的相关概念

医疗大数据的定义

医疗数据是医生对患者诊疗和治疗过程中产生的数据,包括患者基本数据、入出转数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据等,以患者为中心,成为医疗信息的主要来源。

随着医疗卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度快速的增长,以至于无法利用目前主流软件工具,在合理的时间内达到撷取、管理并整合成为能够帮助医院进行更积极目的经营决策的有用信息。规模巨大的临床实验数据、疾病诊断数据以及居民行为健康数据等汇聚在一起形成了医疗大数据。

医疗大数据的主要来源

制药企业、生命科学

药物研发所产生的数据是相当密集的,对于中小型的企业也在百亿字节(TB)以上的。在生命科学领域,随着计算能力和基因测序能力逐步增加,美国哈弗医学院个人基因组项目负责人詹姆·鲍比就认为,到2015年,将会有5000万人拥有个人基因图谱,而一个基因组序列文件大小约为750MB[3]。

临床医疗、实验室数据

临床和实验室数据整合在一起,使得医疗机构面临的数据增长非常快,一张普通CT图像含有大约150MB的数据,一个标准的病理图则接近5GB。如果将这些数据量乘

以人口数量和平均寿命,仅一个社区医院积累的数据量就可达数万亿字节甚至数千万亿字节(PB)之多。

费用、医疗保险、利用率

患者在就医过程中产生的费用信息、报销信息、新农合基金使用情况等。

健康管理、社交网络

随着移动设备和移动互联网的飞速发展,便携化的生理设备正在普及,如果个人健康信息都能连入互联网,那么由此产生的数据量将不可估量。

医疗数据的基本类型

医院信息系统(HIS)数据

HIS是医院的核心系统,是对医院及其所属各部门的人流、物流、财流进行综合管理的系统,围绕着医疗活动的各个阶段产生相关数据,包括各门诊数据及病房数据两大主流数据流。

检验信息系统(LIS)数据

LIS是HIS的一个重要组成部分,其主要功能是将实验仪器传出的检验数据经分析后,生成检验报告,通过网络存储在数据库中,使医生能够方便、及时的看到患者的检验结果。

医学影像存档和传输系统(PACS)数据

PACS数据主要是将数字化医院影像科室日常核磁、CT、超声、各种X线机、各种红外仪等设备产生的图像存储起来。

电子病历(EMR)数据

EMR不同于以医疗机构为中心的门诊或者住院病历,是真正以患者为中心的诊断和其他检验数据的“数据池”,它将患者诊断过程中生成的影像和信号,如X线检查、CT扫描等纳入电子病历中,并以统一的形式组织起来。

医疗大数据的特性

数据规模大(volume)

例如一个CT图像含有大约150MB的数据,而一个基因组序列文件大小约为750MB,一个标准的病理图则大得多,接近5GB。

数据结构多样(variety)

相对于其他行业,医学中的数据类型更加多种多样,如电子病案中关于人口学特征的数据为纯文本型;检验科中有关患者生理、生化指标为数字型;影像科中如B超、CT、MR、X线片等为图像资料。

医疗数据通常会包含各种结构化表、非(半)结构化文本文档(XML和叙述文本)、医疗影像等多种多样的数据存储形式。

数据增长快速(velocity)

一方面,医疗信息服务中包含大量在线或实时数据分析处理,例如,临床决策支持中的诊断和用药建议、流行病分析报表生成、健康指标预警等;另一方面,得益于信息

文档评论(0)

dqy118 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体上海海滋实业有限公司
IP属地湖北
统一社会信用代码/组织机构代码
91310115MA7DL1JF2N

1亿VIP精品文档

相关文档