医疗大数据分析应用平台建设项目产品理念及总体思路.doc

医疗大数据分析应用平台建设项目产品理念及总体思路.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医疗大数据分析应用平台建设项目产品理念及总体思路 医疗卫生、健康保健、医药器械形成的海量数据就象一座待开发的金矿,利用大数据技术、云计算技术、物联网技术和便携设备技术的最新成果,将给医疗卫生事业带来全新革命性的改变,明显解决看病难和看病贵的问题,达到医疗卫生资源配置分布合理、大病小病治疗各司其职、疾病预防治疗有机结合、公民健康保健全过程覆盖。 总体思路 通过建立医疗卫生大数据的统一标准和规范,形成可被相关业务应用所利用的医疗卫生大数据源和交互机制,在此基础上,首先形成专题大数据应用,这些应用具有跨部门和组织机构的通用性,并具有良好的稳定性,因为这些应用是面向医疗卫生专题的;基于专题大数据应用,根据医疗卫生相关部门和组织机构的业务要求,可开发形成各种业务大数据应用,并且随着平台的推广,积累的医疗卫生业务大数据应用的实例将会越来越多,并最终形成不同方向的最佳应用样例。 1.1对接数据源,获取医疗卫生大数据 医疗卫生大数据中心为本平台进行医疗卫生大数据分析提供数据源,但不在本平台范围内,并平台只是开发提供一套与该数据中心的数据读取接口,并具有监控数据读取情况汇总统计和异常提示功能。 该数据中心的定位:整合区域内不同医疗机构中患者/健康人群的各种临床诊疗数据、健康数据,在相对集中的逻辑/物理环境中,构建一个以存储和处理患者/健康人群诊疗信息为核心,覆盖多学科、多专业的面向区域内主要卫生行政主管部门、临床医疗机构和社会公众的医学(医药、医疗、健康)信息资源共享机制----区域性医学数据中心。区域性医学数据中心的建设以行政业务处理、医疗、预防、保健、康复为服务主线,以健康人群和患者的医疗活动需求为基础。区域卫生数据中心通过制定标准的数据接口,建立基于广域网的信息交换、数据采集和传输机制,对区域内医疗卫生信息数据进行采集、传输、清洗和汇总,将医院、社区、医药企业以及公共卫生机构的各类数据、系统有机地整合起来,生成区域的卫生大数据。 1.2对获取的医疗卫生大数据预处理机制 医疗卫生大数据预处理主要完成对已接收数据的辨析、抽取、清洗等操作,目的是将数据按统一的格式提取出来,然后再转化,集成,载入数据仓库的工具 (ETL) 包括:抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的;清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而另一些数据则是完全错误的干扰项。 因此要对数据通过过滤“去噪”从而提取出有效数据。 1.3建立医疗卫生大数据的存储机制 虽然关系型数据库系统(RDBMS)在安装和使用上仍然占有主要地位,但毋庸置疑,非关系型数据库NoSQL技术已经成为今天发展最快的数据库技术。NoSQL是对数据库系统的总称,在某种程度上,它的性能和用途可能完全不同。 目前除了关系型数据库外,还主要存在有以下四种NoSQL数据管理系统: 键值数据库:当数据以键的形式访问时,比如通过国际标准书号ISBN找一本书,键值数据库是最理想的。在这里,ISBN是键,书籍的其他信息就是值。必须知道键才能查询,不过值是一堆无意义的数据,读取之后必须经过翻译。 文档数据库:该数据库以文档的形式管理和存储数据。有点类似于键值数据库,但文档数据库中的数据有结构。与键值数据库中值是一堆无意义的数据不同,文档数据库中数据以文档的结构被描述,典型的是JavaScript Object Notation (JSON)或XML。文档存储数据库中的数据可以通过定义的任何模式进行查询,但键值数据库只能通过它的键进行查询。 列式数据库:也被称为列式存储或宽列存储,一改之前行式存储的方式,对数据进行列式存储。在传统关系型数据库中,数据经常以行来访问。以列式管理记录的NoSQL数据库可以管理大规模的动态列。因为没有固定的模式,所以列名和键可以变换。列式数据库适用于不经常写的情况,要满足ACID(原子性、一致性、隔离性和持久性)的要求并不难,而且模式是变化的。 图型数据库:图型数据库关注值与值之间的关系,用图型的数学概念存储数据。图型数据库用带有点、边缘和属性的图的结构表示和存储数据。在图型数据库中,每一个元素都包含一个直接的指向它毗邻元素的点,所以也就不需要索引查找。 每个种类的NoSQL数据库都有适用的不同类型的应用程序和用例,这就涉及到一个NoSQL社区常用的一个话题,即多样持久性,或者说根据数据库处理应用程序需求的不同,使用不同的数据库系统,用于不同的应用程序和用例。 1.4医疗卫生大数据的处理和分析算法分类和形成 技术分类方法 根据挖掘任务:分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等; 根据挖掘对象:可分为关系数据

文档评论(0)

阿宝 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档