- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘技术在医学研究中的应用
1人工神经网络在医学研究中的应用
人工神经网络(artificial
neuralnetwork,ANN)在各个领域中已经得到广泛的应用,许多领域中已
经成功的应用了ANN,如航天、智能识别、地震预测等。ANN
应用于医学领域亦有近30多年的历史,但是只是在最近10
余年才有较快的发展。目前国内外有相当多的研究在探讨ANN
在临床工作中的应用。ANN应用于疾病的诊断有较高的实用价值。早在
1991年,BaxtWG将ANN用于心肌梗死的诊断,通过适当训练的ANN
诊断心肌梗死的敏感度为97.2%,特异度为
97.5%,明显高于临床医生(77.7%,84.7%)。ElSolhAA等将ANN
应用于活动性肺结核的诊断,结果:训练集中ANN
正确诊断肺结核的灵敏度为100%,特异度为72%;医生的灵敏度为
47%,特异度为75%。测试集中ANN的灵敏度为
100%,特异度为69%;医生的灵敏度为64%,特异度为79%。显然ANN
诊断活动性肺结核的能力高于医生的临床评价,测试集中的结果还表明,
所建的ANN
能很好地推广到新患者的诊断。且ANN应用于临床诊断有较高的敏感性和
特异性。TourassiGD等将ANN应用于肺栓塞的诊断,它从PIOPED
研究的数据中随机抽取了1064份临床资料(其中387
例为肺栓塞,其余681例为非肺栓塞患者)应用于ANN
的训练和检测,并把ANN
的诊断结果同内科医师的诊断结果进行了对比,结果显示:ANN诊断的准
确性比医师的准确性还要高。
同时也指出,用于训练的训练集的例数越多,网络的诊断能力也就越强,
准确性也越高。
应用BP人工神经网络通过运用424
例患者的一般情况、危险因素、症状、体征等7大类59
项资料对网络进行训练构建了一个帕金森病的诊断模型。
通过该模型对113例患者(其中帕金森病患者33例)进行诊断
,结果显示:ANN有较好的诊断价值,其漏诊率为8.3%,误诊率为
6.4%,准确性为92.9%。
通过1200份病例的训练,300例用于训练时的检测,然后对167
例病例进行模拟诊断并同实际结果进行比较,计算出网络诊断的准确性为
91.02%,敏感性及特异性分别为92.79%和87.5%。吴拥军等则将12
项血清学指标运用于BP网络进行肺癌诊断的研究中,其资料构成是50
例肺癌患者、40例肺良性疾病(如肺结核、支气管炎等)以及50
例正常人的CEA、CA125、NSE等12项血清学指标,从中随机抽取了100
例用于网络的训练,其余30例用于检测,研究结果显示:ANN
的肺癌的识别率及预测率分别为
100%,并且可以同时区分是正常、良性疾病还是肺癌。
目前,ANN已用于许多疾病诊断,包括帕金森病、阿尔茨海默病、癫
间
病、孤立性肺结节鉴别诊断、肌肉萎缩、膀胱出口梗阻、泌尿道结石、肺
栓塞等。
2决策树在医学研究中的应用
决策树是一种用树枝状展现数据,受各变量的影响情况的分析预测
模型,是根据对目标变量产生效应的不同而制定分类规则,并且是建立在
信息论基础之上对数据进行分类的一种方法。
另外,它首先通过一批已知的训练数据建立一颗决策树,然后采用建好的
决策树对数据进行预测。
决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则
的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。
采用bootstrap方法对406
例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策
树C4.5算法建立中医辨证模型。通过决策树C4.5
算法筛选出对辨证分型有意义的26
个因素,按其重要程度排序,产生出清楚易懂可用于分类的决策规则,建
立辨证模型,模型分类符合率为:训练集83.6%,验证集
80.67%,测试集81.25%;模型区分各类证型的灵敏度和特异度也较高。
认为决策树C4.5算法建立的模型效果较好,
可用于慢性胃炎中医证型的鉴别诊断。
3粗糙集的数据挖掘技术在医学研究中的应用
粗糙集理论能有效地分析和处理不精确、不一致、不完整等各种不
完备信息,并从中发现隐含的知识,揭示潜在的规律。
近年来得到了迅速的发展和完善。粗糙集理论的出发点是
文档评论(0)