医疗数据分析及数据挖掘方法应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医疗数据分析及数据挖掘方法应用

医疗数据分析及数据挖掘方法应用   摘 要 随着数字化技术的蓬勃发展,高校医疗体系多年“管理信息化”的广泛推行,在高校医疗系统中积累存储了大量信息,由于传统的日常业务系统只对历史数据简单储存管理,无法充分利用医疗信息内部蕴含的相互关联、深层次的数据规律。本文通过对医疗信息处理模型进行研究,构建多层体系结构和框架,提出针对医院信息管理系统的设计框架。利用数据统计和数据挖掘技术来处理数据,采用Apriori算法、时间序列分析等针对诊疗数据和药品数据进行分析。最后,对医疗信息具有的内在知识和数据挖掘方法进行了总结探讨。   【关键词】医疗数据 数据挖掘 时间序列分析   1 概述   医疗信息化建设大大地推动了我国医疗系统的发展,高校作为是国家人才培养基地,往往具有校园社区性质的校属医院。高校医院在医疗信息化建设过程中,也得到了明显发展,为保障师生身体健康,维护教学学习秩序、促进教育改革和高校发展提供了重要保障。医疗信息数据分析服务平台是根据目前高校的医疗信息现状,通过对高校医院的门诊、医药等基本信息之上,通过对数据的清洗、汇集、定向统计与智能分析,提供良好的高校诊疗支持。   全球范围内,医院信息化建设是一个逐渐发展完善的过程,发展历程经历了三个主要阶段:一是医院管理信息化阶段,这个阶段的核心特征为“管理信息化”;二是医院医疗数据的数字化管理,这个阶段的核心特征为“医疗信息化”;三是社会范畴内的医疗信息化和数字化,核心特征为“医院数字化”。国外的医疗信息化建设大多处于第二阶段。早在上世纪60年代,美国著名的麻省总医院开发COSTAR系统,70-80年代,美国的HIS产业已经形成相当的规模。欧洲大多数国家的HIS开始于20世纪70年代中期和80年代初期。   国内医院信息管理系统起步较晚,目前“管理信息化”阶段已经基本完成,为后续发展积累了许多数字化的历史记录,使进一步地数据分析成为可能。历史数据积累,是本论文研究的重要前提。高校医院由于功能定位局限,难以利用建设采用数据挖掘分析方法的数据服务平台,本论文平台研究将致力于如何充分利用这些数字资源,推进医疗信息化建设发展。   2 面向数据分析的平台设计   2.1 软件总体需求   根据医疗数据的特征,系统主要包含以下几方面功能需求:系统权限管理、数据处理与转换、数据分析与统计,数据展示与支持,系统的维护。本系统主要需要考虑:   (1)医疗信息汇集及预处理模块,对医疗数据进行预处理和数据清理、格式统一等操作,并作为后续处理的数据来源。   (2)医疗信息数据分析处理模块,主要功能是对医疗人员关心的医疗数据分类及分项统计,如按所属科室对某段时间就诊人数的统计,来了解该时段内就诊人员的情况规律,对隐含在大量信息后面的规律进行挖掘。   (3)医疗数据展示与服务,主要功能是利用可视化的报表来展示信息,并且提供数据打印、动态可视化展示等。以便医疗部门及时掌控信息分布。   2.2 业务流程及体系   从所处理的信息方面看, 本文涉及的医疗信息分析平台包括药品与就诊信息两各类内容,通过统计分析,对历史累计的医疗数据进行清理汇集,统计,预测,并对其结果进行可视化展示。高校医疗信息服务平台的数据处理主要流程如图1所示。   2.3 系统功能划分   (1)医疗数据采集汇交与预处理。内容有:a. 医疗数据集成及格式的转换,对不同来源、数据形式、多种格式、不同平台的异构信息进行归依化和转换。b. 医疗数据清理与规整化,对大量数据集中包含的噪声数据,通过数据平滑、补充和清除方法,对数据的不一致性,不完整性进行处理,保证后续分析在有效数据集上完成。   (2)医疗信息分析与数据挖掘。内容有:a. 医疗数据各项业务计算与统计,在数据库基础上,通过用户自定义的统计类型,根据用户关注信息,设定时间段的医疗信息进行分类统计,了解信息分布情况。b. 医疗数据挖掘服务功能,根据用户指定项目生成合适的数据视图,利用数据关联分析方法进行信息挖掘,寻找内涵的关联规则,辅助发现隐含知识。   (3)医疗数据展示服务。内容有:a. 报表打印、数据的可视化展示。b. 数据动态可视化,进行图表化显示。   3 数据关联分析   3.1 数据关联分析算法   数据关联的挖掘是本论文的研究关键,数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。例如通过挖掘如果存在疾病名称=“流感” = 年月 =“A”的布尔型的关联规则,就意味着A月份是流感的易发人群,学生的学业压力有可能大于其它时间而有必要进行必要的干涉。   关联规则挖掘的主要算法除了Apriori算法,还包括基于划分算法和FP-树频集算法等。其中Apriori算法是一种最有影响的

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档