数据挖掘技术在医学研究中的应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘技术在医学研究中的应用

1人工神经网络在医学研究中的应用

人工神经网络(artificial

neuralnetwork,ANN)在各个领域中已经得到广泛的应用,许多领域中已

经成功的应用了ANN,如航天、智能识别、地震预测等。ANN

应用于医学领域亦有近30多年的历史,但是只是在最近10

余年才有较快的发展。目前国内外有相当多的研究在探讨ANN

在临床工作中的应用。ANN应用于疾病的诊断有较高的实用价值。早在

1991年,BaxtWG将ANN用于心肌梗死的诊断,通过适当训练的ANN

诊断心肌梗死的敏感度为97.2%,特异度为

97.5%,明显高于临床医生(77.7%,84.7%)。ElSolhAA等将ANN

应用于活动性肺结核的诊断,结果:训练集中ANN

正确诊断肺结核的灵敏度为100%,特异度为72%;医生的灵敏度为

47%,特异度为75%。测试集中ANN的灵敏度为

100%,特异度为69%;医生的灵敏度为64%,特异度为79%。显然ANN

诊断活动性肺结核的能力高于医生的临床评价,测试集中的结果还表明,

所建的ANN

能很好地推广到新患者的诊断。且ANN应用于临床诊断有较高的敏感性和

特异性。TourassiGD等将ANN应用于肺栓塞的诊断,它从PIOPED

研究的数据中随机抽取了1064份临床资料(其中387

例为肺栓塞,其余681例为非肺栓塞患者)应用于ANN

的训练和检测,并把ANN

的诊断结果同内科医师的诊断结果进行了对比,结果显示:ANN诊断的准

确性比医师的准确性还要高。

同时也指出,用于训练的训练集的例数越多,网络的诊断能力也就越强,

准确性也越高。

应用BP人工神经网络通过运用424

例患者的一般情况、危险因素、症状、体征等7大类59

项资料对网络进行训练构建了一个帕金森病的诊断模型。

通过该模型对113例患者(其中帕金森病患者33例)进行诊断

,结果显示:ANN有较好的诊断价值,其漏诊率为8.3%,误诊率为

6.4%,准确性为92.9%。

通过1200份病例的训练,300例用于训练时的检测,然后对167

例病例进行模拟诊断并同实际结果进行比较,计算出网络诊断的准确性为

91.02%,敏感性及特异性分别为92.79%和87.5%。吴拥军等则将12

项血清学指标运用于BP网络进行肺癌诊断的研究中,其资料构成是50

例肺癌患者、40例肺良性疾病(如肺结核、支气管炎等)以及50

例正常人的CEA、CA125、NSE等12项血清学指标,从中随机抽取了100

例用于网络的训练,其余30例用于检测,研究结果显示:ANN

的肺癌的识别率及预测率分别为

100%,并且可以同时区分是正常、良性疾病还是肺癌。

目前,ANN已用于许多疾病诊断,包括帕金森病、阿尔茨海默病、癫

病、孤立性肺结节鉴别诊断、肌肉萎缩、膀胱出口梗阻、泌尿道结石、肺

栓塞等。

2决策树在医学研究中的应用

决策树是一种用树枝状展现数据,受各变量的影响情况的分析预测

模型,是根据对目标变量产生效应的不同而制定分类规则,并且是建立在

信息论基础之上对数据进行分类的一种方法。

另外,它首先通过一批已知的训练数据建立一颗决策树,然后采用建好的

决策树对数据进行预测。

决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则

的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。

采用bootstrap方法对406

例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策

树C4.5算法建立中医辨证模型。通过决策树C4.5

算法筛选出对辨证分型有意义的26

个因素,按其重要程度排序,产生出清楚易懂可用于分类的决策规则,建

立辨证模型,模型分类符合率为:训练集83.6%,验证集

80.67%,测试集81.25%;模型区分各类证型的灵敏度和特异度也较高。

认为决策树C4.5算法建立的模型效果较好,

可用于慢性胃炎中医证型的鉴别诊断。

3粗糙集的数据挖掘技术在医学研究中的应用

粗糙集理论能有效地分析和处理不精确、不一致、不完整等各种不

完备信息,并从中发现隐含的知识,揭示潜在的规律。

近年来得到了迅速的发展和完善。粗糙集理论的出发点是

文档评论(0)

为了知识而活 + 关注
实名认证
文档贡献者

只是改变命运

1亿VIP精品文档

相关文档