2025《基于大数据的医疗诊断平台设计研究国内外文献综述》5200字.docVIP

下载本文档

1
0
约6.2千字
约 6页
2025-07-22 发布于湖北
举报
版权申诉

2025《基于大数据的医疗诊断平台设计研究国内外文献综述》5200字.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第PAGE1页

PAGEII

基于大数据的医疗诊断平台设计研究国内外文献综述

TOC\o1-3\h\u28505基于大数据的医疗诊断平台设计研究国内外文献综述 1

217421.1基于自编码深度神经网络的特征学习方法 1

226381.2基于代价敏感学习的不平衡数据分类方法 2

58621.3医疗诊断平台 4

39761.4研究现状分析 5

本文所面向的医疗数据主要为临床监测指标与患者生理体征等数据，这些数据大多都具有繁杂、不完整、专业性强且不平衡的特性，因此研究针对此类医疗数据的诊断平台主要需要解决两个关键的问题：一是在欠缺医疗相关的专业知识的情况下如何从异构、不完整的数据中学习到对象的有效特征表示；二是在数据不平衡的情况下，如何提高分类模型对于少数类的敏感性。综上，本节将从深度学习、代价敏感学习以及医疗诊断平台三个方面综述国内外研究现状。

1.1基于自编码深度神经网络的特征学习方法

分类的本质是一个依据数据的属性特征将其划分到所属的类别的过程。在构建分类模型时，通常的操作流程是分为两步进行，第一步，发掘合适的特征表示；第二步，基于提取到的特征利用分类器对目标进行分类。在使用的分类器一致的情况下，最终的模型性能将完全取决于所提取到的特征。相较于传统的依据人为提取特征的分类方法而言，深度学习能够被广泛应用的关键在于其能够在缺乏相关专业知识的情况下自动地学习到适合分类的特征表示。栈式自编码器是一种典型的深度神经网络，其能够通过无监督学习提取对象的抽象特征，因而被广泛应用于各种分类任务中，且表现出色[8]。

自编码(AutoEncoder，AE)神经网络这一全新的概念是由Hinton等学者在二十一世纪初期率先提出来的[9]，以受限玻尔兹曼机（RestrictedBoltzmannMachine，RBM）[10]作为网络的基本学习模块，并利用对比散度算法[11]（ContrastiveDivergence，CD）逐层地对网络参数进行学习，最后再通过反向传播算法微调整个网络参数，从而实现了对原始数据的抽象特征提取。其在MNIST数据集上的分类准确率高达98.8%，相较于支持向量机（SupportVectorMachine，SVM）[12]在MNIST上98.6%的准确率而言，分类效果确有一定的提升。该模型结构即为最原始的AE神经网络，在此之后，一些基于原始AE的改进算法被陆续提出。为了提高AE神经网络的隐藏层映射得到的抽象特征的鲁棒性，文献[13]提出了一种降噪AE神经网络，通过将随机噪声加载到原始的输入数据中，以腐化后的数据来代替原始数据作为网络的输入，然后让AE的输出层的输出尽可能地还原原始数据，以此来增强AE神经网络的抗噪性能。其在数据集MNIST上的分类准确率仅为98.72％，但其在加入噪声干扰的MNIST上的表现却优于深度信念网络（DeepBeliefNets，DBN）[14]与SVM，实验表明采用降噪自编码器进行预训练的DNN能够取得更加优秀的分类效果。文献[15]采用连续的AE进行堆叠构筑网络，与传统意义上的非线性映射相比，其多层结构可以有效地完成数据维度的转换。文献[16]利用正则项对网络的目标函数进行约束，提出了一种稀疏的AE网络，实验表明该方法能够显著缩短AE网络的训练时间。文献[17]在AE网络中利用ReLU（RectifiedLinearUnits）来抑制部分神经元，使AE网络变得稀疏，进而避免出现过拟合，此外，还能有效地降低网络的计算开销。

以上文献针对不同的应用场景衍生出了各种自编码器。其中降噪自编码神经网络凭借其优秀的抗干扰能力，十分契合于医疗数据的数据特征和特征学习的需求。然而现有的基于降噪自编码神经网络的特征学习算法也具有一定的局限性，即训练耗时长，容易陷入局部最优解。

1.2基于代价敏感学习的不平衡数据分类方法

主流的代价敏感学习的方法可以被概括为两大类。一类是通用方法，主要包括阈值移动法、采样法以及样本加权法。另外一类是嵌入式方法，它们试图为具体算法设计其代价敏感的版本。

（1）通用法

阈值移动法是一类最为常见的通用方法，其核心的思想就是调整分类的决策阈值，以提高高代价样本的分类精度。最具代表性的阈值移动法为MetaCost[18]，其通过bagging[19]来对目标的后验概率进行预估，然后调整决策阈值给每一个训练样本重新打上标签，最后再以最小化错误率为目标，利用新的标签来训练一个标准的分类器，这样分类器就可以将样本划分到最低风险的类别之中。虽然MetaCost是备受瞩目的一种代价敏感学习方法，然而它却存着在一些不可避免的缺陷。根据阈值移动法赋予训练样本全新的标签，之后再