- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
区域医疗环境下大数据管理问题探讨
刘丽①② 王安莉①②
①中南大学湘雅三医院信息中心,410013,湖南省长沙市桐梓坡路138 号
②湖南省医学信息研究重点实验室
摘 要 随着区域医疗建设进度的加快,大数据问题越来越突出。如何对这些数据进行管理和使用是区域
医疗建设中不可回避的问题。本文按照提出挑战,分析对策,介绍关键技术和典型应用的思路探讨了区域
医疗环境下的大数据管理问题,旨在降低数据管理成本、提高数据使用价值,更好地发挥区域医疗建设的
优越性。
关键词 区域医疗 大数据 数据挖掘 数据存储
1 问题与挑战
我国新医改政策的颁布和实施,不但深化了医疗改革,更大步推进了医疗信息化的建设步伐。医疗信
息化的建设主体已不仅仅局限于单个医院,而是转向了片区整合,朝更深更广的区域医疗方向迈进。区域医
疗不但能实现区域内的医疗信息互通共享,有效缓解 “看病难,看病贵”问题,而且充分利用区域内的医疗
信息资源,更有助于提升医学成果产出和医疗服务水平,促进医疗机构的自身发展。
但这种服务于全社会预防保健、疾病治疗、保障和提高人民健康的数字化、网络化、智能化的基础性
支撑体系建设,也为医疗数据的管理和使用带来了巨大的挑战,其中两个首要的挑战是: (1)如何将分散在
不同层次、不同机构的医疗数据进行整合,使各级医疗服务人员在任何时间、任何地点都能及时获取必要
的信息,以支持高质量的医疗服务?(2)区域医疗的建设使得医疗大数据问题更加突显,如何努力控制大数
据造成的呈螺旋上涨的成本、复杂性和风险已经成为一个至关重要的问题。
2 对策分析与关键技术
要想应对这两个突出的问题,首先,从数据经济学角度分析,如何使从数据中获取价值的成本低于数据
能产生的效益?如果我们能够有效地将数据存储、处理和保护成本降至最低,然后利用尖端技术将数据转
化成支持临床需要与业务增长的可执行信息,我们就能实现最高的数据经济效益。其次,从数据管理和使用
技术角度分析,要想提高大数据的使用价值,减少其管理成本,先进的数据挖掘技术和数据存储技术必不可
少。
2.1 大数据存储管理技术 信息计算现已进入以数据为中心的时代,存储行业是目前最热门的领域之一。在
大数据环境下,最适用的存储管理技术是分布式文件系统、分布式数据库以及访问接口和查询语言。
分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网
络与节点相连。大数据解决方案中有代表性的为HDFS。
分布式数据库系统有两种:一种是物理上分布的,但逻辑上却是集中的。这种分布式数据库只适宜用
途比较单一的、不大的单位或部门。另一种分布式数据库系统在物理上和逻辑上都是分布的,也就是所谓
联邦式分布数据库系统。由于组成联邦的各个子数据库系统是相对“自治”的,这种系统可以容纳多种不
同用途的、差异较大的数据库,比较适宜于大范围内数据库的集成。大数据解决方案中有代表性的为Hbase。
2.2 大数据分析与挖掘技术 数据挖掘就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的
模式的非平凡过程,其模型如图1 所示。
甄疽丽,≤j,磊:)‘磊’、未,m*%一 m*4甄面i
图1 数据挖掘模型
针对大数据挖掘问题,传统的数据挖掘方法已经不能适用于当前的数据规模,因为传统的数据挖掘是
在数据仓库中进行的,随着数据量的不断增长,噪音数据也随之增加,面对这种情况,数据仓库对于数据
挖掘在时间和空间上的限制,使得大数据的数据挖掘在数据仓库中计算已经不现实。因此我们考虑在区域
医疗环境下采用何种数据挖掘技术来应对医疗大数据问题,来提高传统数据挖掘技术的可扩展性是十分有
意义的。
3 关键技术进展
3.1 大数据存储技术的主要进展 目前大数据存储技术路线最典型的共有三种:
第一种是采用MPP 架构的新型数据库集群如图2 所示,重点面向行业大数据,采用Shared Nothing 架
构,通过列存储、粗粒度索引等多项大数据处理技术,再结合MPP 架构高效的分布式计算模式,完成对分
析类应用的支撑,运行环境多为低成本PC Server,具有高性能和高扩展性的特点,在企业分析类应用领域
获得极其广泛的应用。这类MPP 产品可以有效支撑PB 级别的结构化数据
文档评论(0)