- 1、本文档共76页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘在甲状功能减退症分类中的应用与研究
摘要
医疗信息化的发展,诊断数据量的激增,需要结合数据挖掘技术进行深入分析,提
取有潜在意义的知识。当前基于甲状腺功能减退症(简称甲减)的分类挖掘研究较少,只
是纯粹地从医疗分析的角度,统计学原理的角度,单一数据挖掘模型的角度出发,未能
将统计方法与数据挖掘技术有机结合,也未能将数据挖掘的多种模型进行综合性地比较
分析,以此决定甲减分类模型的优劣。
本文针对甲减分类在以上研究领域的不足,挖掘甲减的不同测量数据,从统计原理
的方法和实际应用两方面对多种分类模型进行了较为深入的研究。从变量要求、数据鲁
棒性、时间运行、结果解释、分类准确率和性能伸缩性等多因素,综合研究了三类模型
的性能优劣,对临床甲减分类诊断具有一定的参考作用和指导意义。本文所做的主要工
作有:
1)阐述了数据挖掘技术的相关概念和主要应用领域,较为深入地分析了数据挖掘
过程CRISP.DM中的各个实施阶段,及其产生的相应结果。结合研究与应用,对甲减
分类进行较为透彻的业务理解。同时在数据理解过程中,进行了甲减属性的深入探索,
使训练集和测试集的选择具备一般性。在数据准备方面,针对相关变量字段存在的缺失
值,离群值,无用属性或冗余属性等情况,进行了较为全面的数据分析和数据预处理工
作。
2)基于数据模型的统计学原理,本文着重探讨了统计方法与数据挖掘的异同之处
数学原理及应用。通过建立相应的数据挖掘模型,得出了甲减分类的主要判别指标。以
统计原理的方法与多种数据挖掘模型相结合的方式,进行了较为全面的数据统计分析和
挖掘算法研究,找到较优的挖掘模型,并进一步将三种模型从不同测量因素上进行综合
分析与比较。
性的甲减挖掘研究与开发,从总体上和细节上有机地把握挖掘实施过程的六个阶段,以
一种结构化的、体系化的、标准化的、可视化的流程进行数据挖掘工作。利用Script脚
本语言开发数据挖掘的整个过程,从而改善了那些手动的、重复的、耗时的工作任务,
有利于在操作界面上实现过程的自动化和处理对象的批量化。
Abstract
Withthe ofmedicalinformationandtheincrementof is
data,it
development dia印ostic
toextractthe and the ofdata
necessary potentialsignificantknowledgeusingdeepanalysis
on classificationisnot
currentresearchbased
miningtechnology.The hypothyroidismmining
the and ofd雒sijEication
todetermine
enough disadvantages
good advantages
itcd)mes ofmedical the data
fromthe mining
perspective analysis,statisticaltheory,orsingle
withstatisticalmethodanddata to and
model,notcombing mining,andfailingcompare
the ofdata models
文档评论(0)