数据挖掘技术在医学研究中的应用.pdfVIP

下载本文档

1
0
约3.53千字
约 6页
2025-05-24 发布于上海
举报
版权申诉

数据挖掘技术在医学研究中的应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘技术在医学研究中的应用

1人工神经网络在医学研究中的应用

人工神经网络(artificial

neuralnetwork，ANN)在各个领域中已经得到广泛的应用，许多领域中已

经成功的应用了ANN，如航天、智能识别、地震预测等。ANN

应用于医学领域亦有近30多年的历史，但是只是在最近10

余年才有较快的发展。目前国内外有相当多的研究在探讨ANN

在临床工作中的应用。ANN应用于疾病的诊断有较高的实用价值。早在

1991年，BaxtWG将ANN用于心肌梗死的诊断，通过适当训练的ANN

诊断心肌梗死的敏感度为97.2%，特异度为

97.5%，明显高于临床医生(77.7%,84.7%)。ElSolhAA等将ANN

应用于活动性肺结核的诊断，结果：训练集中ANN

正确诊断肺结核的灵敏度为100%，特异度为72%；医生的灵敏度为

47%，特异度为75%。测试集中ANN的灵敏度为

100%，特异度为69%；医生的灵敏度为64%，特异度为79%。显然ANN

诊断活动性肺结核的能力高于医生的临床评价，测试集中的结果还表明，

所建的ANN

能很好地推广到新患者的诊断。且ANN应用于临床诊断有较高的敏感性和

特异性。TourassiGD等将ANN应用于肺栓塞的诊断，它从PIOPED

研究的数据中随机抽取了1064份临床资料（其中387

例为肺栓塞，其余681例为非肺栓塞患者）应用于ANN

的训练和检测，并把ANN

的诊断结果同内科医师的诊断结果进行了对比，结果显示：ANN诊断的准

确性比医师的准确性还要高。

同时也指出，用于训练的训练集的例数越多，网络的诊断能力也就越强，

准确性也越高。

应用BP人工神经网络通过运用424

例患者的一般情况、危险因素、症状、体征等7大类59

项资料对网络进行训练构建了一个帕金森病的诊断模型。

通过该模型对113例患者（其中帕金森病患者33例）进行诊断

，结果显示：ANN有较好的诊断价值，其漏诊率为8.3％，误诊率为

6.4％，准确性为92.9％。

通过1200份病例的训练，300例用于训练时的检测，然后对167

例病例进行模拟诊断并同实际结果进行比较，计算出网络诊断的准确性为

91.02％，敏感性及特异性分别为92.79％和87.5％。吴拥军等则将12

项血清学指标运用于BP网络进行肺癌诊断的研究中，其资料构成是50

例肺癌患者、40例肺良性疾病（如肺结核、支气管炎等）以及50

例正常人的CEA、CA125、NSE等12项血清学指标，从中随机抽取了100

例用于网络的训练，其余30例用于检测，研究结果显示：ANN

的肺癌的识别率及预测率分别为

100％，并且可以同时区分是正常、良性疾病还是肺癌。

目前，ANN已用于许多疾病诊断，包括帕金森病、阿尔茨海默病、癫

间

病、孤立性肺结节鉴别诊断、肌肉萎缩、膀胱出口梗阻、泌尿道结石、肺

栓塞等。

2决策树在医学研究中的应用

决策树是一种用树枝状展现数据，受各变量的影响情况的分析预测

模型，是根据对目标变量产生效应的不同而制定分类规则，并且是建立在

信息论基础之上对数据进行分类的一种方法。

另外，它首先通过一批已知的训练数据建立一颗决策树，然后采用建好的

决策树对数据进行预测。

决策树的建立过程是数据规则的生成过程，因此这种方法实现了数据规则

的可视化，其输出结果容易理解，精确度较好，效率较高，因而较常用。

采用bootstrap方法对406

例样本进行扩增以满足数据挖掘对样本量的要求，采用基于信息熵的决策

树C4.5算法建立中医辨证模型。通过决策树C4.5

算法筛选出对辨证分型有意义的26

个因素，按其重要程度排序，产生出清楚易懂可用于分类的决策规则，建

立辨证模型，模型分类符合率为：训练集83.6%，验证集

80.67%，测试集81.25%；模型区分各类证型的灵敏度和特异度也较高。

认为决策树C4.5算法建立的模型效果较好，

可用于慢性胃炎中医证型的鉴别诊断。

3粗糙集的数据挖掘技术在医学研究中的应用

粗糙集理论能有效地分析和处理不精确、不一致、不完整等各种不

完备信息，并从中发现隐含的知识，揭示潜在的规律。

近年来得到了迅速的发展和完善。粗糙集理论的出发点是

您可能关注的文档

文档评论（0）

为了知识而活 + 关注: 实名认证

文档贡献者

只是改变命运

咨询Ta 进入空间

1亿VIP精品文档

更多 >

数据挖掘技术在医学研究中的应用.pdfVIP