- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据挖掘的临床医疗数据分析系统
第33 卷 第1 期
2012 年02 月
长春工业大学学 报(自然科学版)
Vol.33No.1
JournalofChangchun UniversityofTechnology(NaturalScienceEdition) Feb.2012
基于数据挖掘的临床医疗数据分析系统
郑丹青
(株洲职业技术学院 电子信息工程系,湖南 株洲 412001)
摘 要:运用元数据管理方法设计了基于数据挖掘的临床医疗数据分析系统,并将该系统应
用于胃癌术后复发的危险因素分析。 实验结果表明,胃癌术后复发危险因素有胃切除、家族遗 传、术后化疗。 通过元数据管理和 weka软件平台,使分析系统具有了扩展性和可视化性。
关键词:数据挖掘;元数据;医疗系统;设计
中图分类号:TP311
文献标志码:A
文章编号:1674-1374(2012)01-0045-04
Clinicaldataanalysissystembasedondatamining
ZHENG Dan-qing
(DepartmentofElectronicsandInformationEngineering,ZhuzhouProfessionTechnologyCollege,Zhuzhou412001,China)
Abstract:With metadatamanagementtechnique,aclinicaldataanalysissystemisdesignedbasedon
data mining.Thesystem isappliedtotheanalysis ofrecurrenceriskfactors ofgastriccancer.
Experimentalresultsshow thatfactorsincludegastricresection,familyhistory,andpostoperative
chemotherapy.Through metadatamanagementandwekasoftwareplatform,the??nalyticalsystemcan beextendedandvisualized.
Keywords:datamining;metadata;medicalsystem;design.
如采用贝叶斯学习分类方法对男女患者的图像进
行自动诊断,将数据挖掘用于肝癌遗传综合征的 自动检测[2],运用决策树方法,以医院病案室保存 的冠状动脉粥样硬化性心脏病(简称冠心病)病案 中选取了一些数据作为挖掘的原始数据集进行医 疗数据分析[3]等。 在医院信息系 统 中,利 用 决 策 树方法进行医院信息系统挖掘及医疗政策分析[4] 等。
近年来,随着医院信息化建设的发展,电子病
引
言
0
数据挖掘是从大量的、不完全的、有噪声的、
模糊的、随机的实际应用数据中,寻找有意义、有 价值信息的过程。 数据挖掘可以应用于任何类型 的信息储存库(如关系数据库、数据仓库、事务数 据库和高级 数 据 库 系 统)以 及 瞬 态 数 据 (如 数 据 流)[1]。 目前,数据挖掘在医学领域的应用主要集 中在疾病辅助诊断、药物开发、医院信息系统中的 应用和遗传学方面的应用等。 在疾病诊断方面,
历和病案的大量应用,医疗设备和仪器的数字化,
收稿日期:2011-10-25
基金项目:湖南省高等学校科学研究项目(09C1310)
作者简介:郑丹青(1962-),女,汉族,湖南邵阳人,株洲职业技术学院副教授,主要从事管理信息系统、数据库及数据挖掘方向研 究,E-mail:dqzhengh@yahoo.com.cn.
使得医院数据库系统中积累了大量有关病人的病
数据挖掘的实现过程
2
史、诊断、检验和治疗的临床信息,而如何利用数
据挖掘技术从医院信息系统中抽取、清洗和变换 数据,采用分类、聚类、关联分析等方法构建临床 医疗数据分析系统。 通过对患者资料数据库中大 量历史数据处理、提炼蕴含其中的大量有价值的 信息,发现隐藏的关系和模式,预测未来的发展趋 势,已成为医院信息化建设中所需要进一步研究 的课题。 其中,对疾病的临床诊断、治疗和预后的 关系研究也是医学科学研究很重要的方面[5]。
文中将以 胃 癌 术 后 复 发 的 危险因素分析为 例,探讨构建基于数据挖掘的临床医疗数据分析 系统,并运用元数据管理方法,使用户可以根据数 据分析的需要自行选取数据分析模型中的变量, 使系统具有灵活性和扩展性。
数据选取
2.1
为了进行胃癌术后复发情况分析,首先确
胃癌术后复发与哪些因素有关,从中选取年龄
切除、家族遗传、营养状况、术后化疗、是否复发
相关信息作为数据挖掘项目的变量,这些变量
据类型及取值范围见表1。
表1
定义数据分析模型的变
文档评论(0)