网站大量收购独家精品文档,联系QQ:2885784924

决策树数义据挖掘技术在医学诊断中的应用分析.docx

决策树数义据挖掘技术在医学诊断中的应用分析.docx

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树数义据挖掘技术在医学诊断中的应用分析

摘要近些年来,数据挖掘(Data 摘要 近些年来,数据挖掘(Data Mining)技术在医学上已经得到了广 泛的应用。本文从手术诊断实际需要出发,研究了决策树挖掘技术在 医学诊断中的应用研究问题,并且构建了一个可视化的实验系统。 本文首先简要阐述本课题的研究背景,指出将决策树技术应用于 医学诊断的理论意义和现实意义。同时,介绍本文的研究内容、创新 点以及理论分析框架。本文引入了决策树基本理论、决策树建树算法、 决策树前后剪枝算法。其中重点介绍如何利用决策树算法生成决策 树,以及PEP后剪枝算法和卡方测试前剪枝算法,并用实例进行阐 述。主要介绍对手术诊断决策表的数据预处理过程。根据手术诊断信 息的特点,利用等频离散化算法及泛化技术将手术诊断信息进行离散 化预处理,得到离散化了的手术诊断信息决策表。本论文的主要创新 点是决策树的可视化实现,就如何将一棵多叉树美观的呈现出来进行 了详细的阐述,提供了可操作的算法,并分析了该算法的时间复杂度。 进一步的文章介绍了基于决策树理论的决策系统。该系统在 Jbuliter2006平台下开发,实现了从手术诊断信息决策表读取、创 建决策树、决策树前后剪枝、规则提取及输出保存的一整套算法,在 上面的几个步骤中,显示决策树、规则集或测试结果都可以通过本系 统进行可视化的显示。实现了从抽象的决策树生成到具体的显示该决 策树、从生成到最后的测试和规则提取的整个过程。最后用手术诊断 决策表进行测试,结果证明了程序和算法的正确性。 论文最后对本文的研究结论进行了归纳和总结,阐述了本项研究 的启示和主要贡献,也指出了本项目研究中的不足和下一步的研究方 向。 关键词决策树,前剪枝,后剪枝,数据挖掘,可视化,医学诊断 ABSTRACTIn ABSTRACT In recent years,Data Mining Technology has been widely used in medicine field which is all effective tool for dealing with original。data from medical records.Out of practical need for medical diagnosis,this paper presents experimental software basing on decision tree technology. The dissertation discusses the background of the study,points out the theoretical and practical significance of the study,introduces the research contents and the possible innovations,and explains the analysis structure of the thesis.In the second,it introduces in detail the decision tree algorithm and presents examples analysis.In this paper,the research work focuses on decision tree generation,pre—pruningpost-pruning algorithms and visible technology for decision tree.And the visible technology iS the innovation of this theme.Firstly,on the characteristic of diagnosisoperation,the continuous attributes discrete algorithms such as the frequency interval method or the generalize method are used for its first division to achieve a reductiondiscreted purpose;Secondly,it generates a decision tree basing on the algorithm and particularly descript the pessimistic error post·pruning(PEP)and the chi—square pre—pruning (CHI).Finally,it introduces the visible techno

您可能关注的文档

文档评论(0)

189****6821 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档