- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医疗诊断系统中的数据预处理
医疗诊断系统中的数据预处理
2005年1月
第12卷第1期
控制工程
ContmlEngineeringofChina
Jan.2005
Vo1.12.No.1
文章编号:1671—7848{2005)01—0033—04
医疗诊断系统中的数据预处理
张思奇,周淑文,巩志国,董名垂
(1.澳f1大学科技学院,澳门3001;2.东北大学机械工程与自动化学院,辽宁沈阳110oo4)
摘要:针对长期积累的病历数据不仅数量庞大,记录方式,内容千差万别,而且噪声,
缺省值大量存在的问题,提出了智能医疗诊断系统,利用以往的病历数据经过数据挖掘等技
术来产生决策规则,以期为潜在的患者及早发现病情,获得早期诊治:总结了病历文本的记
录内容和特点,对每一类的特点和形成原因进行了分析研究,并结合医疗诊断分别提出了针
对它们的预处理方法,为下一步数据挖掘做好了准备.
关键词:数据挖掘;医疗数据;数据预处理
中图分类号:TP274文献标识码:A
DataPreprocessinMedicalDiagnosisSystem
ZHANGSi-qi,ZHOUShu-welt,GONGZhi-guo,DONGMing-chui
(1.FacultyofScienceandTechnology,MacauUniversity,Macau3001,China;
2.CollieofMechanicalEngineeringandAutomation,NoaheastemUniversity,Shenyang110004,China)
Abstract:Intelligentheahhcaresystemdataprepmcesspmblemisdiscussed.Itistohelpprospectivepatientfindhisconditionassoonas
possiblewithdecisionrulesproducedbasedonmedicalcasesbyusingdataminingtechnology.Medicalcasesarenotonlyhugeinamount,but
alsodifferentfromeachotherinreco~stylesandcontents.Thecontentandcharacteristicofmedicalcasesissummarized.Combiningwith
medicaldiagnosis,itaimsateachkindtobringforwardtheideaofdatapreproce~fordataminingrespectively.Theprop0sedmethodmakes
goodpreproce~fordatamining.
Keywords:datamining;medicaldata;datapreprocess
l引言
数据挖掘(DataMining,DM)是随着数据库技术
和人工智能的发展而迅速兴起的边缘学科,它通过
对海量历史数据的智能处理,可以揭示出反映事物
内在规律和预测发展趋势的规则或模式.DM在许
多领域有着极其重要的作用,智能医疗诊断就是其
中之一.
长期积累的病历文本的医疗数据是相当庞大
的,对这些数据可以集中运用各种数据挖掘技术,
了解各种疾病的典型症状,各种疾病的共性,各种
疾病的发展规律等,为医疗诊断提供新的思路.此
项工作对疾病的诊断,治疗和医学研究都是非常有
价值的.利用DM技术对医学相关的研究很多,包
括对心脏SPECT图像的数据挖掘…,医学数据库
中疾病模式的发现],可视化数据挖掘l3等方面的
研究.数据挖掘的各种技术和方法在医学领域都有
广泛的应用,在今后的几年里,医学领域内的数据
挖掘技术水平会更高,应用会更广.
2在线智能医疗诊断系统简介
在线智能医疗诊断系统,是澳门大学科研委员
会资助项目Network.based,Intelligent,Home
HeM~eareSystem.设计者尝试用数据挖掘对一些
实际的医疗数据进行分析.从珠海某医院病案室保
存的冠状动脉粥样硬化性心脏病(简称冠心病)病历
中选取了一些数据作为挖掘的数据源.之所以选择
冠心病作为研究对象是因为该病种与其他心脏病病
种相比发病率较高,约占80%.该项目的目的是通
过对这些病历数据的分析,得到一些有价值的诊断
规则,帮助潜在的患者及早发现病情,以便获得最佳
治病时机.在线智能医疗诊断系统如图1所示.
收稿日期:2004-08.10;收修定稿日期:2004-09.18
基金项目:澳门大学科研委员会资助项目(RGO49/02-03S/VM1/FST)
作者简介:张思奇(1978-),女,辽宁沈阳人,硕士研究生,主要研究方向为数据挖掘,数据仓库的理论与应用.
文档评论(0)