基于压缩感知的癌症基因表达数据的分类分析-classification and analysis of cancer gene expression data based on compressive sensing.docxVIP

基于压缩感知的癌症基因表达数据的分类分析-classification and analysis of cancer gene expression data based on compressive sensing.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于压缩感知的癌症基因表达数据的分类分析-classification and analysis of cancer gene expression data based on compressive sensing

致谢当论文完成时,我在思考研究生这三年做了什么。去年,我不幸生了场大病,让我明白很多道理,但是学业却荒废了很多,论文出的比较少,编程的水平没有提高太多,也许塞翁失马,焉知非福,这场病让我淡定了很多,不去过分追求很多东西了。在此我要感谢我的导师陆慧娟老师和潘晨教授,在写论文和生活方面给了我很多帮助,对我也很宽容,他们在论文的选题,论文的思路方面给了我很多帮助,他们对学术的严谨和认真,让我很钦佩,再次表示对陆老师和潘老师最深切的敬意和感谢。感谢何灵敏、郑恩辉、杨小兵、谭劲、潘巨龙等老师,他们对我的论文写作给予了很大的帮助,为本论文的撰写提供了很多宝贵的意见。感谢10级的褚娜,胡玲龙,陈财熊,邱帧艳,王娟,彭立军,跟他们在一起很开心,在编程方面总能提供给我宝贵的意见,感谢师兄陈伍涛,张金伟,师妹安春霖、魏莎莎,师弟刘金勇、张聪,他们对我的论文和生活给予了很大的帮助。最后,感谢我的父母和牟玲秀,他们在我最潦倒的时候一直帮助我,他们就是我生活的最大动力。陆江江2013年3月基于压缩感知的癌症基因表达数据的分类研究摘要:随着人类基因组计划的进行,DNA微阵列技术运用到肿瘤疾病研究中,产生了大量维数高、样本少的癌症基因表达数据。如何从海量的基因表达数据中发现和提取少量具有分类识别能力和最小冗余度的特征基因,挖掘出有用的知识和信息,比较全面地认识癌症的基因本质、获得对“癌症-基因”间关系的真实反映,对推进恶性肿瘤的临床诊断与治疗,进一步研究癌症、发现癌症的致病机理是非常重要的。本文利用压缩感知的理论对癌症基因表达数据进行分类,把癌症基因表达数据分类问题归结为求解测试样本对于训练样本的稀疏表示问题,通过求解癌症基因表达数据的重构来解决;通过计算重构的残差,根据残差来判断测试样本类别。这种分类方法不需要反复训练来构建分类器,只要测试样本在训练样本上的投影足够稀疏,就能取得比较好的分类效果,并且耗时比较少。本文主要研究内容如下:1.高维癌症基因数据的降维研究。利用基于信噪比(SNR)、主成分分析法、基于Relief过滤法、基于Fisher准则这4种方法将癌症基因数据进行降维,然后使用压缩感知方法对降维后的数据进行分类以评估降维效果。研究表明,主成分分析法后的特征更有利于求解稀疏解,分类精度比较高。2.癌症基因表达数据的重构算法。运用训练样本组成的完备字典,通过信号的重构算法,找到用完备字典中表示测试样本的稀疏解,然后计算残差,残差最小的项即为测试样本的类别。在重构算法中利用L1 范数最小化来求解稀疏解,与Bagging神经网络、SVM和ELM的识别效果进行比较和分析,实验表明即使是分类效果比较差的Brain数据集,也能达到平均80%左右的分类精度。3.重构算法的速度优化。在信号重构算法中利用正交匹配追踪算法来求解,分类精度与L1 范数最小化的分类方法相差不多,但比L1 范数最小化算法节省约50%的时间,从而显著提高了癌症基因表达数据的重构速度,有利于运用于低计算能力或者高计算速度要求的设备中。关键词:基因表达数据;压缩感知;稀疏向量;残差;L1范数最小化;正交匹配追踪算法分类号:TP183IClassification of CancerGene Expression Data Based on Compressed SensingAbstract:DNAmicroarraytechnologyisappliedtothestudyofneoplasticdiseasewithalargenumberofhighdimensionality,smallsamplesizeof cancergene expressiondata.Itisveryimportanttopromotetheclinicaldiagnosisandtreatment ofmalignanttumors.However,howtofindthefeaturegenesisverycritical,that couldbenefittocancerclassificationorrecognitionwithminimumredundancyfrom massivegeneexpressiondata,Thisresearchcoulddigouttheusefulknowledgeand information, understandcancergene essentiallymore comprehensivelyand getatrue reflectionoftherelationshipbetweencancer-genes.Inthis paperthetheoryof compressedsensingisusedforclassificationofcance

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档