大型医院数据湖存储的设计和实现.docx

大型医院数据湖存储的设计和实现.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

??

?

??

大型医院数据湖存储的设计和实现

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

[摘要]本文针对大型医院海量结构化、半结构化、非结构化数据的存储问题,设计和实现了一种数据湖存储方案。该存储方案通过构建三个“统一”,二个“分布”,一个“闭环”,即统一存储数据、统一命名空间、统一资源池、分布式存储、分布式元数据和缓存、数据安全闭环,做到了性能和容量线性提升前提下的百PB级别不同类型数据的混合、持久存储;实现了多协议数据出站、入站;支撑了存储与算力分离后的数据复用。该方案相较于传统存储区域网络,适应大数据分析、深度学习和预测、物联网数据实时采集场景。数据不再需要重复地导出,真正做到了一份数据,多次复用,不仅节省了大数据分析和人工智能预测项目的成本,提高了效率,而且确保了数据安全。

[关键词]医院数据;数据湖;大数据;人工智能

TheDesignandImplementationofDataLakeStorageinLarge-scaleHospital

WengJinyang

RuiJinHospitalShanghaiJiaoTongUniversitySchoolofMedicine,ComputerNetworkCenter,Shanghai,200025

Abstract:Inthispaper,adatalakestorageschemeisdesignedandimplementedforthestorageofmassivestructured,semi-structuredandunstructureddatainlarge-scalehospitals.Bybuildingthreeunifications,twodistributionsandoneclosedloop(i.e.unifiedstoragedata,unifiednamespace,unifiedresourcepool,distributedstorage,distributedmetadataandcache,datasecurityclosedloop),thestorageschemeachievesthemixedandpersistentstorageofdifferenttypesofdatawithhundredPBlevelunderthepremiseoflinearimprovementofperformanceandcapacity;realizestheoutboundandinboundmulti-protocoldata;supportsthedatareuseaftertheseparationofstorageandcomputingpower.Comparedwiththetraditionalstorageareanetwork,thisschemeissuitableforbigdataanalysis,deeplearningandprediction,andreal-timedatacollectionscenariosoftheInternetofThings.Thedatanolongerneedtobeexportedrepeatedly,sotheycanbereusedmanytimes,whichnotonlysavesthecostofbigdataanalysisandartificialintelligencepredictionproject,improvestheefficiency,butalsoensuresthedatasecurity.

Keywords:hospitaldata;datalake;bigdata;artificialintelligence

引言

随着医院信息化朝专科化、个性化纵深发展,以及人工智能、物联网等各类新型诊疗、管理手段的应用,期间产生的覆盖疾病防治、健康管理各个环节的结构化、半结构化、非结构化数据,呈爆炸式增长。这些海量原始数据,是国家重要的基础性战略资源,蕴藏着多种能力,具有不可估量的价值。如何统一、持久、安全、可复用地存储这些数据,成为医院面临的课题。瑞金医院为解决此问题,而设计和实现的基于

文档评论(0)

155****0304 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档