- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE1页
第PAGE1页
PAGEII
基于大数据的医疗诊断平台设计研究国内外文献综述
目录
TOC\o1-3\h\u28505基于大数据的医疗诊断平台设计研究国内外文献综述 1
217421.1基于自编码深度神经网络的特征学习方法 1
226381.2基于代价敏感学习的不平衡数据分类方法 2
58621.3医疗诊断平台 4
39761.4研究现状分析 5
本文所面向的医疗数据主要为临床监测指标与患者生理体征等数据,这些数据大多都具有繁杂、不完整、专业性强且不平衡的特性,因此研究针对此类医疗数据的诊断平台主要需要解决两个关键的问题:一是在欠缺医疗相关的专业知识的情况下如何从异构、不完整的数据中学习到对象的有效特征表示;二是在数据不平衡的情况下,如何提高分类模型对于少数类的敏感性。综上,本节将从深度学习、代价敏感学习以及医疗诊断平台三个方面综述国内外研究现状。
1.1基于自编码深度神经网络的特征学习方法
分类的本质是一个依据数据的属性特征将其划分到所属的类别的过程。在构建分类模型时,通常的操作流程是分为两步进行,第一步,发掘合适的特征表示;第二步,基于提取到的特征利用分类器对目标进行分类。在使用的分类器一致的情况下,最终的模型性能将完全取决于所提取到的特征。相较于传统的依据人为提取特征的分类方法而言,深度学习能够被广泛应用的关键在于其能够在缺乏相关专业知识的情况下自动地学习到适合分类的特征表示。栈式自编码器是一种典型的深度神经网络,其能够通过无监督学习提取对象的抽象特征,因而被广泛应用于各种分类任务中,且表现出色[8]。
自编码(AutoEncoder,AE)神经网络这一全新的概念是由Hinton等学者在二十一世纪初期率先提出来的[9],以受限玻尔兹曼机(RestrictedBoltzmannMachine,RBM)[10]作为网络的基本学习模块,并利用对比散度算法[11](ContrastiveDivergence,CD)逐层地对网络参数进行学习,最后再通过反向传播算法微调整个网络参数,从而实现了对原始数据的抽象特征提取。其在MNIST数据集上的分类准确率高达98.8%,相较于支持向量机(SupportVectorMachine,SVM)[12]在MNIST上98.6%的准确率而言,分类效果确有一定的提升。该模型结构即为最原始的AE神经网络,在此之后,一些基于原始AE的改进算法被陆续提出。为了提高AE神经网络的隐藏层映射得到的抽象特征的鲁棒性,文献[13]提出了一种降噪AE神经网络,通过将随机噪声加载到原始的输入数据中,以腐化后的数据来代替原始数据作为网络的输入,然后让AE的输出层的输出尽可能地还原原始数据,以此来增强AE神经网络的抗噪性能。其在数据集MNIST上的分类准确率仅为98.72%,但其在加入噪声干扰的MNIST上的表现却优于深度信念网络(DeepBeliefNets,DBN)[14]与SVM,实验表明采用降噪自编码器进行预训练的DNN能够取得更加优秀的分类效果。文献[15]采用连续的AE进行堆叠构筑网络,与传统意义上的非线性映射相比,其多层结构可以有效地完成数据维度的转换。文献[16]利用正则项对网络的目标函数进行约束,提出了一种稀疏的AE网络,实验表明该方法能够显著缩短AE网络的训练时间。文献[17]在AE网络中利用ReLU(RectifiedLinearUnits)来抑制部分神经元,使AE网络变得稀疏,进而避免出现过拟合,此外,还能有效地降低网络的计算开销。
以上文献针对不同的应用场景衍生出了各种自编码器。其中降噪自编码神经网络凭借其优秀的抗干扰能力,十分契合于医疗数据的数据特征和特征学习的需求。然而现有的基于降噪自编码神经网络的特征学习算法也具有一定的局限性,即训练耗时长,容易陷入局部最优解。
1.2基于代价敏感学习的不平衡数据分类方法
主流的代价敏感学习的方法可以被概括为两大类。一类是通用方法,主要包括阈值移动法、采样法以及样本加权法。另外一类是嵌入式方法,它们试图为具体算法设计其代价敏感的版本。
(1)通用法
阈值移动法是一类最为常见的通用方法,其核心的思想就是调整分类的决策阈值,以提高高代价样本的分类精度。最具代表性的阈值移动法为MetaCost[18],其通过bagging[19]来对目标的后验概率进行预估,然后调整决策阈值给每一个训练样本重新打上标签,最后再以最小化错误率为目标,利用新的标签来训练一个标准的分类器,这样分类器就可以将样本划分到最低风险的类别之中。虽然MetaCost是备受瞩目的一种代价敏感学习方法,然而它却存着在一些不可避免的缺陷。根据阈值移动法赋予训练样本全新的标签,之后再
您可能关注的文档
- 2025《X村卫生室实习毕业报告》1100字.docx
- 2025《宠物医院实践活动报告》1200字.docx
- 2025《垃圾焚烧系统中的二恶英的控制和除臭设计概述》1400字.docx
- 2025《地铁车站通风空调系统的发展》1500字.docx
- 2025《XX汽车4S店汽车美容社会实践报告》1500字.docx
- 2025《爱尔眼科公司SWOT分析案例》1300字.docx
- 2025《企业内部审计问题研究的国内外文献综述》1800字.docx
- 2025《组织行为学》课程总结报告2500字.docx
- 2025《ARP工作原理及攻击危害分析概述》1500字.docx
- 2025《护理人员职业暴露的现状分析》2100字.docx
- 2025《基于单片机的智能照明系统方案设计案例》1900字.docx
- 2025《基于微信小程序的校园表白墙设计的需求分析和总体设计案例》4200字.docx
- 2025《甲胺生产工艺中的平面布置、经济核算及三废排放方案设计案例》1000字.docx
- 2025《甲醇制烯烃急冷水系统简述》1700字.docx
- 2025《江苏省公立医疗机构执行三医联动典型政策的现状与困境调研分析报告》6100字.docx
- 2025《江阴数字经济与制造业融合发展情况调查研究》9800字.docx
- 2025《焦化废水处理的污水处理站总体布置分析案例》1900字.docx
- 2025《焦化废水处理工艺中的污泥处理设计计算案例》1200字.docx
- 2025《介质的介电常数测量研究国内外文献综述》2700字.docx
- 2025《卷板机的原理概述》1300字.docx
文档评论(0)