医疗+大数据(第二版).pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医疗+大数据 目录 医疗大数据的背景 1 医疗大数据的特点 2 大数据相关技术 3 大数据项目展示 4 医疗大数据的价值 5 医疗大数据平台的初步构思 6 一、医疗大数据的背景 二 、医疗大数据的特点 三 、大数据相关技术 四、 大数据项目展示 五、 医疗大数据的价值 六、 医疗大数据平台初步构想 医疗大数据的背景 医疗大数据的背景 0 15000 10000 5000 2010 2011 2012 2013 2014 2015 Admin Imaging EMR Email File Non Clin Img 数据量(PB) 数据来源: McKinsey Global Institute Analysis 医疗大数据的背景 医疗大数据的背景 计算 存储 数据库 网络 单机 集群 文件存储 单机 设备间连接 设备内连接 关系型数据库 10GE FC IB 分布式数据库 非关系型数据库 块存储 10GE SAS IB 横向扩展 块级虚拟化 横向扩展 分布式文件系统 医疗大数据的背景 时间 部门 政策 2011 卫生部 《基于电子病历的信息平台建设技术解决方案(1.0版)》 2012 卫生部 《健康中国2020战略研究报告》 2014 卫技委 《基于电子病历的医院信息平台技术规范》 2014 卫技委 《电子病历基本数据集》 2014 卫技委 《基于居民健康档案的区域卫生信息平台技术规范》 2015 国务院 《促进大数据发展行动纲要》 2016 国务院 《关于促进和规范健康医疗大数据应用发展的指导意见》 备注:近几年部分政策 一、医疗大数据的背景 二 、医疗大数据的特点 三 、大数据相关技术 四、 大数据项目展示 五、 医疗大数据的价值 六、 医疗大数据平台初步构想 医疗大数据的来源 医疗大数据的特点 多样性 性 高速性 大量性 大量性 大量性 多样性 大量性 高速性 大量性 价值性 多样性 性 高速性 大量性 时序性 大量性 隐私性 大量性 缺失性 大量性 冗余性 一、医疗大数据的背景 二 、医疗大数据的特点 三 、大数据相关技术 四、 大数据项目展示 五、 医疗大数据的价值 六、 医疗大数据平台初步构想 大数据相关技术 适合海量数据处理 灵活的可扩展性 成本的低廉性 故障容灾能力强 大数据相关技术—分布式存储分布式计算 大数据相关技术—Hadoop集群 大数据相关技术—Hadoop安全体系及监控 安全体系 身份认证:Kerberos 身份管理:LDAP 授权访问:服务授权、文件授权、数据授权 数据加密 通信加密 … 监控体系 ClouderManger Ganglia Eagle … 大数据相关技术—数据收集 Flume:常用于收集非关系型数据数据,如:各种操作访问服务日志、诊断病历、影像数据等 Sqoop:常用来在关系型数据库和非关系型数据库之间导入导出数据 Flume:常用于收集非关系型数据数据,如:各种操作访问服务日志、诊断病历、影像数据等 大数据相关技术—数据存储 HDFS:分布式文件系统,便于存储各种格式的数据,具有很高的吞吐量和备份容灾能力 Hbase:分布式的面向列存储的数据库,具有较强的实时性,底层依赖HDFS文件系统 大数据相关技术—数据分析和挖掘 Spark或Storm: 处理实时性高的数据,该类技术中间数据存储在内存中,故运算速度快。 MapReduce、Hive或Pig: 处理实时性不是很高的数据,可采用MapReduce、Hive、Pig批处理的技术,该技术的中间数据是存储在物理磁盘,故速度相对较慢。 大数据相关技术—数据推荐与语义分析 Mahout:提供了机器学习的算法,包括协同过滤、分类、聚类等,它将很多机器学习算法转出mapreduce任务运行在分布式集群中,提升机器学习的性能。 SolrClould或ElastiSearch:分布式搜索引擎,提供对各种类型数据的分词和检索的功能,用户可以很方便的获得具体特定关键字的各种结构化、非结构化数据。 一、医疗大数据的背景 二 、医疗大数据的特点 三 、大数据相关技术 四、 大数据项目展示 五、 医疗大数据的价值 六、 医疗大数据平台初步构想 部分项目介绍—云知道检索系统 基于分布式solrCloud集群的实时和离线海量日志检索平台 部分项目介绍—云知道检索系

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档