基于肺结节检测系统的特征选择算法研究x.docxVIP

基于肺结节检测系统的特征选择算法研究x.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SHANGHAI JIAO TONG UNIVERSITY学士学位论文THESIS OF BACHELOR论文题目:基于肺结节检测系统的特征选择算法研究学生姓名: 张坤 学生学号: 5060379055 专 业: 软件工程 指导教师: 孙焱 学院(系): 软件学院 基于肺结节检测系统的特征选择算法研究摘要肺癌是当今对人类生命健康危害最大的恶性肿瘤之一,其发病率在癌症中位居第一,也是世界上恶性肿瘤中最常见的死亡原因。特别近半个世纪以来,各国肺癌的发病率和病死率都急剧上升。在中国,肺癌是死亡率排名第一的恶心肿瘤疾病,30年来的发病率增长了4倍。然而,如果早期发现和治疗肺癌,患者的五年存活率可由14%提高到49%[2]。肺结节正是肺癌的早期表现。肺结节是肺部最常见的病变之一,可能是良性病变、转移瘤或肺癌。因此,肺结节的早期检测和诊断对肺癌早期诊治十分重要。计算机辅助诊断(Computer-Aided Diagnosis,CAD)是近年来随着计算机技术的发展而应用于影像诊断领域的一项新技术。随着影像检查技术的发展,医学影像数据不断增加,影像诊断医师的工作越来越繁重,这对他们的体力和脑力都提出了巨大的挑战。医师在阅片过程中自然会受到来自各方面因素的影响,造成的漏诊、误诊时有发生。建立在计算机数字图像处理技术之上的CAD技术则相当于阅片医师的得力助手,因其计算速度快,可重复性好,能极大地减轻影像诊断医师的工作强度,起到帮助医师把关的作用。CAD利用专业的计算机算法分析医学影像,发现并检出病变部位,帮助放射科医生提高病灶检出率,被称为放射科医生的“第二双眼睛”。CAD系统的开发已有一段历史,在图像分析工作中,人们一直在使用计算机技术,期望找到一些可靠的线索,帮助提高计算机的图像分析性能,并将这些研究成果应用于人体各个病变部位的检测之中,目前CAD系统主要应用于肺部、乳腺、盆腔及头颅等部位的疾病检测和诊断,而肺部癌症的检测是其中的一个典型。一般情况下,检测系统的准确率高低与否主要取决于分类器的分类性能,而分类器又往往是特征敏感的,因此如何通过特征选择技术提高特征集的分类质量成为了此类研究的主要努力方向。特征选择已经成为了那些需要处理成百上千个特征的应用领域的研究热门。特征选择的目标有三个:改进分类器的预测精度,提供更加快速和性能优越的分类器和加深对当前生成数据的处理过程的理解。特征选择有许多潜在的好处:促进数据的可视化和数据解读,降低测量和存储需要,减少训练和应用所需时间,克服维数灾难以提高预测的性能。关于这个主题有许多值得讨论的问题和方法,从不同的角度思考也会提出不同的观点和工作方向,而本篇论文则主要聚焦于构建和选择对于一个分类器来说有用的特征子集。这意味着我们需要从众多特征中评价并选择出所有与问题的解决相关度尽可能高的各种特征。然而考虑到实际的需求和性能等各种问题,对于分类器来说选择出相关度最高的特征集其实通常是次最优化的,这种情况在特征冗余性比较强的时候尤为突出。相应地,即使一个特征集是非常有效的,其中也难免包含一些冗余但有确实相关性强的特征类型。本文主要关注两种特征选择技术:搜索类算法和遗传算法。对于搜索算法,文章不仅给出了其概念和一般形式,而且提供了各种分支算法的伪代码描述和比较说明。并最终在应用中实现了性能上较为优越的浮动前向搜索算法。关于进化计算,我们给用了较多篇幅从基本的框架、各部分的实现策略到改进方法都进行了非常详尽的解释,并且实现了加入局部搜索的混合遗传算法,这种算法克服了传统遗传算法局部收敛速度慢的缺陷,使得全局最优解的收敛速度大大提高,是当前的混合遗传算法中较为主流的解决方案。分类器部分,我们使用了经典的k-近邻分类算法,由于其非参数化并且具有较高的特征敏感性,所以能够提供针对特征选择算法的性能的有效的评价机制。在设计与实现环节,文章介绍了模式识别工具库PRTK,它是为构建特征选择系统而专门设计的可复用的算法工具集。为了测试算法的性能,我们构建了基于UCI机器学习标准数据的XML配置化测试框架,对浮动搜索算法与混合遗传算进行了参数、准确率和时间开销等方面的单独以及比较测试,证明了算法的有效性。关于涉及到的具体应用:肺结节检测系统,我们介绍了系统的构成并简单阐述了特征选择过程之前的各个流程与技术。通过对集成了特征选择与分类模块的肺结节检测系统进行的测试,我们得到了初步而有效的实验结果,相当程度上反映了特征选择的有效性。关键词:特征选择,前向浮动搜索算法,混合遗传算法,k-近邻算法,肺结节检测STUDY OF LUNG NODULE DETECTION SYSTEM BASED FEATURE SUBSET SELECTION ALGORITHMABSTRACTLung cancer is one o

您可能关注的文档

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档