基于网格的临床医学数据挖掘技术的应用研究.docVIP

基于网格的临床医学数据挖掘技术的应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网格的临床医学数据挖掘技术的应用研究.doc

基于网格的临床医学数据挖掘技术的应用研究   摘 要:该论文的研究视角是当前比较热门的临床医学数据挖掘,分析了临床医学数据的存储特点,提出了依托医院现有网络实现医院的海量临床医学数据挖掘的方法,为医院在疾病诊断和治疗、医学科研与教学、医院管理等方面提供帮助。   关键词:网格 数据挖掘 临床医学数据   中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2015)10(c)-0149-02   快速发展的网格计算将网络上分散的计算机建成了一个虚拟的计算机体系,实现了网络上存在的分散资源的共享,为分布在不同的地方、结构不同的动态变化数据提供了一个存储容器。网格技术一出现就引起了广泛的关注,Globus Toolkit 4推出了支持Windows的Java Ws-Core软件包以来,使网格在Windows下的开发有了一个新的依托平台。数据挖掘改变了数据处理技术,从数据库中提取有用的知识,给决策者提供技术支持。目前,很多决策性的知识都来源于网络,这样,用户需要处理大量的原始数据。将网格技术与数据挖掘结合起来,就可以解决网络上分散数据的挖掘问题。网格技术与数据挖掘技术日渐成熟,完全可以把两者结合起来,完成网络上分散的海量数据的挖掘任务。随着网格技术的逐步成熟,网格的研究也从科学研究单位扩大到了社会的诸多领域,许多商业机构,学校,政府等部门都逐步引入了网格研究应用平台。网格给我们提供的分布式计算平台具有分布式系统的优势,同时弥补了分布式系统自身的许多缺陷。如将网格应用到分布式医院系统,建立一个基于网格的数据挖掘系统,必将使其在疾病诊断和治疗、医学科研与教学、医院管理等方面发挥巨大作用。   1 医学数据的存储特点   医院网络的特点决定其数据源的存储和分布在空间上呈现分布异构特点。分布式数据源是指在物理上分布而逻辑上集中的数据源系统。分布式医学数据源作为数据挖掘工作的对象,是使用计算机网络将地理位置分散的多个逻辑单位(各个节点上的数据集)连接起来,它们的管理和控制又需要不同程度集中,共同组成一个数据源。即分布式数据源可以看成是计算机网络与多个不同组织节点上数据集的有机结合,分布式医学数据源存储特点具有以下几点:(1)物理分布性,数据分散存储在网络中的多个节点上;(2)逻辑全局性,物理上分散存储的在各个节点的数据逻辑上是一个全局数据源;(3)节点自治性,各个节点的数据由本地用户管理,具有自治处理能力,可以完成本节点的挖掘应用,即局部数据挖掘。   分布式医学数据源在数据空间分布、数据结构表达等方面存在许多差异,目前国内外对分布式数据源的分类和定义没有统一的标准,比较认同的分类方法有两种:(1)按局部数据模型分类,分为同构型和异构型。(2)按分布式数据源控制系统的类型分类,分为集中型、分散型和可变型。   2 临床医学数据挖掘的特点   临床医学数据包含的信息非常丰富和复杂,目前基本所有医院都有病人的电子病历,病人的B超、CT、X光、心电图等影像资料也对疾病诊断起到一定的辅助作用,加之涉及到病人信息的病理参数、化验结果等临床信息,它们形成了一个复杂类型的数据库系统,该数据库涉及到病人、科室、医院管理层等多个方面。而临床医学信息又具有隐私性、多样性、不完整性、冗余性、异质性和缺乏数学性质等自身特性,使得临床医学数据与常规的数据挖掘之间存在很大的差异。临床医学数据的挖掘方法主要有统计法、机器学习方法、神经网络法和数据库法,这些方法遍布疾病的诊断、治疗和预防分析以及医院管理的各个方面。   临床医学数据库按是否含有医学影像数据可简单的归纳为两类:第一类为医学影像加上其他相关的医学参数的数据库;第二类为无医学影像的纯医学参数的数据库。该论文主要研究纯医学参数的数据库,以结构化为主的关系型数据为主要研究对象。在医疗实践中产生的大量的结构化医学数据,可以从医院和患者的角度分析这些数据,涉及到医院的信息包括每个科室信息统计和全院数据汇总等方面,涉及到患者的信息包括登记挂号、门诊就诊、开单检查、手术及药物处置、入院治疗、划价交费等方面。   根据临床医学数据源存储特点建立的网格中,处在这个网格中的每台计算机就是这个网格的一个节点,称之为网格节点。通过上面的分析可知,基于网格的临床医学数据挖掘需求分析可以分为两类:支持网格中心控制节点的数据挖掘需求分析和支持局部网格节点的数据挖掘需求分析。   3 支持网格中心控制节点的数据挖掘需求分析   网格中心控制节点主要处理医院的综合信息。根据医院的实际情况,其现实需求可能有很多种,这里不一一举例,只列举几项。   (1)病人构成分析。分析门诊病人和住院病人性别、年龄、身份、职业等方面,从而得到不同类型病人的经济状况、主要需求医疗服务类型等信息,能够有针对

文档评论(0)

lmother_lt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档