计算机辅助医学影像诊查之关键学习技术研究.docVIP

下载本文档

2
0
约4.03千字
约 5页
2017-08-15 发布于广东
举报
版权申诉

计算机辅助医学影像诊查之关键学习技术研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机辅助医学影像诊查之关键学习技术研究.doc

　　计算机辅助医学影像诊查之关键学习技术研究 --第1章绪论 1.1计算机辅助诊断概述医学影像学中的计算机辅助诊断技术通常分为三类：图像处理。图像处理的是让计算机易于识别可能存在的病变，让计算机从复杂的解剖背景中将病变及可疑结构识别出来。此过程需要将图像数字化，如果是数字化图像如DR、CT、MR图像则可省去此步。各种病变运用不同的图像处理方法，基本原则是图像增强与过滤将可疑病变从正常解剖背景中分离、显示出来；（2)图像分析。对图像中感兴趣的目标进行检测和测量(特征提取)，它是一个从图像到数据的过程。最为典型的就是计算机辅助检测(puter Aided Detection)。在这个阶段计算机只具有初级人工智能的功能。当进行诊断工作时，计算机会告诉我们兴趣区(Range Of Interest, ROI)在哪里，提醒我们要特别注意这些区域的细微改变。而对于兴趣区性质的识别，还是需要我们人去进行；（3)图像理解。研究图像中各目标的性质和相互关系、理解图像含义。它是一个从图像到高级描述、识别的过程，这就是计算机人工智能的高级阶段一计算机辅助诊断。这个阶段计算机收集大量同病种、同部位的影像学信息建立“知识库”。利用机器学习技术针对“知识库”进行训练，使计算机“学会”根据以往的“经验”对当前的影像病变做出诊断建议。 ………… 1.2数据挖掘概述近十年来，数据挖掘与机器学习在医学辅助诊断、模式识别、欺诈检测等诸多领域得到了广泛应用与研究。数据挖掘与机器学习能有效分析原始数据，提取数据背后的隐含模式、发掘新知识并做出正确判断。与人类从过往经验中学习知识并利用其解决未来问题类似，数据挖掘从已知的经验数据中发现知识，并利用学习所得知识对未知数据进行判断。通常数据挖掘中所涉及的数据信息是以属性值（attribute-value)表示。数据包含许多实例（对象、样本等），每个实例以多个通用意义的特征来表示，而每个特征由有效的符号或数字值表示。数据实例及所含特征隐含地表达了知识，学习算法是将知识以能被理解及应用的形式表示出来。多年来由于分类在实际应用中的重要性而成为机器学习与数据挖掘中最主要的研究方向。本论文是研究分类问题，特别是二分类问题。许多分类方法已经被大家所熟知，譬如 KNN(K-Nearest Neighbor),NBC(NaYve Bayes Classifier),LDA(Linear Discriminant Analysis!),ANN(Artificial Neural Net(Support Vector Machines)，Boosting 和 Bagging 等。许多先进学习算法及其各类改进算法能得到非常高的分类精度，例如采用SVM混合学习算法对基因微阵列数据的分类准确率可达90%以上甚至100%，并且不断有学者提出分类性能更优的学习算法。经过学者们对新学习算法的充分研究，目前设计更优性能的分类算法是一件十分困难的工作。分类算法的高准确率给人们一种机器学习无所不能的感觉，认为机器学习方法可以解决所有的分类问题，然而这样的印象与现实相去甚远。众所周知，目前还存在许多学习分类难题，譬如针对非平衡、有噪.稀缺等数据的学习分类。 ………… 第2章相关研究现状 2.1非平衡数据集数据集中当某一类别所包含的样本数显著少于其它类别的祥本数时，我们称之为非平衡数据集。进一步发现样本数少的类别往往是学习任务中用户最感兴趣的类别。许多实际的分类应用中都会出现非平衡样本集例如污染检测[29]，风险管理[21]、欺诈侦察[22]以及医学辅助诊断123_24]，非平衡数据集的分类问题引起学者们广泛的研究兴趣。在非平衡环境下，经典机器学习算法产生的分类界面偏离大类，会有更多稀有类样本被错分为大类，造成稀有类样本的识别率显著降低。非平衡的数据分布自身似乎不会影响学习过程，而以下与非平衡数据相关的困难阻碍了正常的学习过程。通常情况下非平衡样本集中没有充足的稀有类样本，使得学习机面临小样本问题，此时稀有类样本的识别率会显著降低。研究表明在固定非平衡比例的情况下随着稀有类样本数增加，稀有类别概念得到更为充分地表达，稀有类样本误判率也将随之降低。此时尽管样本集依然为非平衡分布，然而充分的样本能帮助学习机建立更为准确的稀有类概念模型。然而现实中收集更多阳性样本却是一项困难的工作。类别重叠问题。类别之间如果没有重叠，无论样本集是否平衡，任何一个简单的学习技术都能得到一个合适的分类器将类别完全分开。如图2-l(a)所示当类别重叠问题出现时，学习机很难推导出合适的判别准则。此时学习机通常会、推导出更普遍的判别准则，也就是稀有类别的样本更容易被误判。 ………… 2.2非平衡学习性能评价充分、详尽地评测学习算法性能是一项重要而且必要的工作，同时也是一项具有挑战性的任务。