基于极限学习机的基因表达数据分类算法研究-控制理论与控制工程专业论文.docxVIP

基于极限学习机的基因表达数据分类算法研究-控制理论与控制工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 中图分类号 TP181 学校代码 10356 UDC 004.8 密级 公开 硕 士 学 位 论 文 MASTER DISSERTATION 基于极限学习机的基因表达数据 分类算法研究 Study on Classification of Gene Expression Data Based on Extreme Learning Machine 作 者 安春霖 导 师 陆慧娟、杨小兵 申请学位 工学硕士 培养单位 中国计量学院 学科专业 计算机应用技术 研究方向 机器学习 二〇一四年六月 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得 中国计量学院 或其他教育机构的 学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 学位论文作者签名: 签字日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解 中国计量学院 有关保留、使用学位论文的 规定。特授权 中国计量学院 可以将学位论文的全部或部分内容编入有关数 据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借 阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论 文在解密后适用本授权说明) 学位论文作者签名: 导师签名: 签字日期: 年 月 日 签字日期: 年 月 日 致 谢 研究生生活已接近尾声,在此我首先要感谢我的导师陆慧娟教授,她从我 的论文选题直到定稿,整个过程都给予了我很大的帮助和鼓励。她不仅在学术 上给予我悉心的教导,在我的生活上也给予了诸多照顾和关心。其次,我要感 谢我的第二导师杨小兵副教授,他对我的论文写作思路方面给予了很大的启发 和指点。在此,我对陆老师和杨老师表示由衷的感谢和深深的敬意! 在我整个研究生期间,多次得到潘晨、郑恩辉、陆羿、王明怡、朱建明等 老师的指导,他们帮助我解决了很多学术上的困惑,对我的论文也提出了很多 宝贵的意见,在此真诚的感谢他们对我悉心的指导和无私的帮助。 感谢师兄张金伟、陆江江,在我刚刚踏入研究生大门时,引领我入门,让 我用最短的时间了解所研究课题。 感谢 11 级同学,张曼曼、周茜、刘倩、崔慧、李欠欠、侯庆岑、汪磊、范 振涛、陈林伟,谢谢他们在研究生生活中带给我快乐和帮助。感谢刘金勇、张 聪,与他们的交流和讨论拓宽了我的思路,感谢师妹魏莎莎,师弟王石磊、刘 亚卿,他们对我的学习、生活给予了很大的帮助。 感谢王旺,在我的求学路上不管遇到多大的困难,都会用最积极的心态引 导我,让我能够向着目标不停的努力。 最后,我要感谢我亲爱的父母,他们永远是我最有力的支持者,是我最坚 实的后盾,正是他们的包容、支持和教育我才得以顺利完成学业,谢谢。 安春霖 2014 年 6 月 基于极限学习机的基因表达数据分类算法研究 摘要:极限学习机(Extreme Learning Machine,ELM)具有分类速度快,分类 精度高的优点,已经越来越多地用于基因表达数据分类中,但是个体极限学习 机具有分类的不稳定性。随着分类技术的发展,集成学习可以克服单个极限学 习机用于数据分类时性能欠稳定的缺点,已经成为分析基因表达数据获取生物 学信息的有力工具。然而当所给样本的误分类代价不相等时,对基因表达数据 进行分类就不能仅仅以提高分类精度为目标,应该在高分类精度的基础上最小 化误分类代价。本文将针对基因表达数据的分类进行研究,主要内容如下: (1) 提出了极限学习机的相异性集成算法(D-ELM):分别基于两种测度提 出了基于输出不一致测度的极限学习机相异性集成算法(D-D-ELM)和基于错 误一致测度的极限学习机相异性集成算法(DF-D-ELM)。首先对相异性测度 (输出不一致测度、错误一致测度)进行分析,建立相应的剔除规则;然后对 极限学习机进行相异度的判断,根据相应的剔除规则剔除冗余的极限学习机; 采用多数投票技术集成筛选后的极限学习机;最后用该集成系统对基因表达数 据进行分类。实验表明:D-ELM 算法能够有效提高极限学习机的分类精度,并 且能够进一步得出 DF-D-ELM 算法要优于 D-D-ELM 算法。 (2) 提出了极限学习机的代价敏感学习算法(CS-ELM) :首先在分类时引入 概率估计的思想,将分类概率与误分类代价相结合;然后在此基础上进一步嵌 入拒识代价实现极限学习机的代价敏感分类。实验表明:CS-ELM 算法,虽然 牺牲了误分类代价较低的大类别样本的分类精度,但降低了整体样本的误分类 代价,实现了最小化误分类代价的目的。 (3) 提出了嵌入代价敏感的极限

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档