临床数据挖掘中应用OLAP技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
临床数据挖掘中应用OLAP技术

临床数据挖掘中应用的OLAP技术   本文讨论了数据仓库的设计,在线交易处理系统(OLAP)的概念,以及从OLTP中提取数据的问题。同时也阐述了OLTP的数据模型,以及在这些空间模型中的量值和纬度的概念。   医疗管理部门、医疗监测部门、医院、医疗保险公司等机构每天都可能要处理数百万条的医疗数据,因此都需要使用到医疗卫生保健数据。这些医疗机构对处理这种医疗数据是比较熟悉的,不过却不擅长对这些数据进行深入的分析。临床医疗数据的数据量、复杂性和安全性对临床医疗数据的分析造成了很大的挑战。值得一提的是,处理医疗数据和分析医疗数据之间的存在着巨大差异。   临床数据挖掘系统是基于信息共享平台的SOA开放式构架,为医疗机构提供智能化临床数据挖掘与管理决策支持功能。对于信息的展示方式,临床数据挖掘系统采用报表、各类统计图、趋势分析图和仪表盘(Dashboard)等技术,把重要的决策支持信息整合在一起,便于综合判断决策。同时,临床数据挖掘系统需要从数据仓库的构建开始。   医疗数据的特点及数据仓库的构建   数据仓库存储的是大量的医疗数据,医疗数据具有如下特点。   1. 医疗数据的隐私性(Privacy)   医疗数据不可避免的涉及到患者的一些隐私信息,当这些隐私信息使患者在日常生活中遭遇到不可预料的侵扰时,就产生了侵犯患者隐私的问题。医疗数据挖掘者有义务和责任在保护患者隐私的基础上进行科学研究,并且确保这些医疗数据的安全性和机密性。   2. 医疗数据的多样性   由于医疗数据是从医学影像、实验数据以及医生与患者的交流中获得的,所以原始的医疗数据具有多种形式。医疗数据的多样性是它区别于其它领域数据的最显著特征。   3. 医疗数据的不完整性   医疗数据的搜集和处理过程经常相互脱节,这使得医疗数据库不可能对任何疾病信息都能全面的反映。   4.医疗数据的冗余性   医疗数据库是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含重复的、无关紧要的、甚至是相互矛盾的记录。   此外,医疗数据还具有时间性特征。   数据仓库是支持决策过程的、面向主题的、集成的、与时间有关的、持久的数据集合,它以传统的数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效方法,以人工智能技术作为挖掘知识和发现规律的科学途径,是与网络通信技术、面向对象技术、并行技术、多媒体技术、人工智能技术等相互渗透、互相结合与综合应用的技术。   创建数据仓库,是从已有数据出发的数据仓库的设计方法,称之为“数据驱动”的系统设计方法,它的基本思路是:利用以前建设的数据库系统的数据,按照分析领域对数据及数据之间的联系重新考虑,组织数据仓库中的主题,利用数据模型有效的识别数据和数据仓库中的主题数据的“共同性”(即建立主题间相互联系的属性)。   构建一个数据仓库需要完成抽取主题、组织数据、获取与集成数据和建立应用。湖南省第二人民医院的临床数据挖掘与管理决策支持系统将在数据仓库上展开。   在线分析处理系统(OLAP)   通常情况下,临床医生和医疗管理者等医疗数据的最终使用用户都不得不依赖于程序来将自己的需求翻译成程序查询语言后,才能使用医疗数据。由于数据提取过程非常复杂,因此临床医生和医疗管理者很少能够直接访问到原始数据。   OLAP数据库在结构和使用方法上与关系数据库有所不同。关系数据库在结构上主要围绕“表”、“视图”和“查询”这些关系数据库中的基本数据术语来解决相关的数据库问题。与其形成对照的是,OLAP数据库的结构围绕着维度和量值来设计解决相关的数据库问题。关系数据库的首要问题是保存数据,OLAP数据库的设计是以快速和有效的方法来重新获取数据。   OLAP数据库的使用界面与关系数据库的使用界面是完全不同的。多数普通的OLAP使用者界面是Excel表格,可以自动将数据排列到表格的行和列中。大多数临床和医疗管理者是熟悉Excel的,且有一定的电子制表软件的使用经验,经过短期的培训就可以使用OLAP系统。   OLAP数据库中,自己的设计方法是最重要的。一个好的OLAP数据库的设计首先要定义更多的方法来报告项目,这些项目应保持正确性和一致性。例如,一个“内科医生访视”项目可以定义为仅包括诊室内的访视,也可以包括整个医院内或者急诊部门的访视。一旦定义的项目达成统一,就可以通过选择合适的CPT编码定义量度,使用者今后将使用“内科医生访视”量度,而不用担心它的定义。为了创建这些定义,需要彻底理解这些数据和可能使用的数据,这些在设计OLAP数据库时是最基础的。   OLAP数据库通常比关系数据库更容易升级,体现了它适应数据增长的能力。关系数据库的大小依赖于记录的数目,而OLAP数据库的

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档