- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Hadoop的个人健康信息服务系统.doc
基于Hadoop的个人健康信息服务系统
摘要:个人健康信息服务系统作为现代医院健康管理系统的一个重要分支,在整个医疗系统中起着十分重要的作用。本文论述了通过Hadoop大数据平台构建了一种个人健康信息管理的方法,设计并且实现了一套基于Hadoop的个人健康信息管理系统。Hadoop作为一种日趋成熟的大数据平台,与医疗信息化相结合,为个人医疗中产生的数据提供了一种安全可靠的存储途径,实现医疗数据的集中管理。本系统利用Hadoop平台适合海量数据的运算与存储的特点,建立了个人健康信息数据中心,实现对患者健康信息最完整、最准确的管理。
中国 8/vie
关键词: Hadoop个人健康信息服务系统; 大数据; 数据中心
中图分类号: TP391.41
文献标志码: A
: 2095-2163(2016)06-0009-04
0引言
随着大数据技术的发展,供其使用的场景也越来越多。对于寻求数据集中管理、旨在收获高效益,远程存取自动化的医疗领域,Hadoop可以为建立个人健康信息中心提供一个理想的平台。在基于Hadoop的个人健康信息服务系统中,患者的电子个人信息、医疗记录和相关资料可以进行完整、统一管理,系统资源可以由一个或者若干个医疗机构高度共享,并集中存放,将不再局限在某个医院单独的信息系统中。而使用Hadoop平台构建个人健康信息数据中心后,医疗机构可以同步降低在软件和硬件上的投入、推进医疗机构的信息化程度,并且提升医院的收益率。现如今,随着电子医疗信息的快速增长,Hadoop大数据平台无疑会对医疗领域产生重大影响。
2009年,中华人民共和国卫生部公开颁行了《基于健康档案的区域卫生信息平台建设指南》,使医疗管理者能动态掌握卫生服务资源和利用信息,实现科学管理和决策,从而达到有效地控制医疗费用的不合理增长、减少医疗差错、增进医疗与服务质量的功能规划目的。通过个人健康信息服务系统,将分散在不同机构的健康数据整合为一个逻辑完整的信息整体,满足与其相关的多种机构与人员的基础现实需要。这是一种全新的卫生信息化建设模式。
本系统基于Hadoop平台,使用Hbase存取数据,通过大数据的技术和概念对个人的医疗数据进行存储和交换,实现个人健康档案管理的广泛共享。
1相关理论与技术
[1.1Hadoop
Hadoop是Apache 软件基金会旗下的一个开源分布式计算平台。实现时是以Hadoop分布式文件系统(HDFS)和MapReduce为核心,为用户提供了系统底层细节透明的分布式基础架构。HDFS具有高容错性和高伸缩性,且基于Java语言开发,使得Hadoop可以部署在低廉的硬件上,形成分布式系统。MapReduce分布式编程模型允许用户在不了解分布式系统底层细节情况下开发并行应用程序。
Hadoop是一个能够让用户轻松架构和使用的分布式计算平台,主要表现有以下优点:
1)高可靠性。Hadoop按位存储和处理数据的能力值得信赖。
2)高扩展性。Hadoop是在可用的计算机集群间分配数据完成计算任务,这些集群可以方便地扩展到数以千计的节点。
3)高效性。Hadoop能够在节点间灵活地移动数据,以保证各??节点的动态平衡,因此处理速度甚称优异。
4)高容错性。Hadoop可以自动保存数据的多份副本,并且能够将失败的任务重新分配。
HDFS和MapReduce是Hadoop的两大核心。下面首先介绍HDFS的体系结构。HDFS采用了主从(Master/Slave)结构模型,HDFS单元集群则是由一个NameNode和若干DataNode组成。其中,NameNode作为主服务器,管理文件系统的命名空间和客户端对文件的访问操作;DataNode管理存储的数据。HDFS允许用户以文件的形式存储数据。从内部来看,文件被分成若干个数据块,分置在不同的DataNode上。NameNode执行文件系统的命名空间操作,比如打开、重命名、关闭文件或目录等,同时还进一步负责数据块到具体DataNode的映射。在此基础上,DataNode将负责处理文件系统客户端的文件读写请求,并可在NameNode的统一调度下执行数据块的创建、复制和删除工作。HDFS的体系结构如图1所示。
其次,MapReduce是一种并行编程模式。在该模式控制下,用户可以轻松地编写分布式并行程序。而且,还将负责将任务分发到由成百上千台计算机组成的集群上,并以一种可靠容错的方式并行处理大量的数据集,实现Hadoop的并行任务处理功能。
综上可知,HDFS在集群上实现了分布式文件系统,MapReduce在集群上实现了分布式计算和任务处理,二者共同组成了Hadoop分布式系统的核心。
[
文档评论(0)