微阵列数据分析中基因选择及样本分类方法研究.pdf

微阵列数据分析中基因选择及样本分类方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博士论文 微阵列数据分析中的基因选择及样本分类方法研究 摘要 微阵列技术给生物学研究领域提供了极为丰富、详尽的基因表达信息。对微阵 列数据的分析研究可以帮助人们理解生命现象的机理,并促进医学向更精确的诊疗 方向发展。鉴于基因微阵列数据的高维小样本、高噪声等特点,迫切需要借助于先 进的计算方法来分析和利用这些原始信息。 微阵列数据分析是生物信息学的重要研究课题,检测差异表达基因、最大化样 本分类准确率是其中两大关键技术。本文从基因选择、基因约简、样本分类三方面 展开研究,并取得如下研究成果: 首先研究了差异表达基因选择问题,提出了基因差异表达显著性阂值的计算方 法。该方法通过构造一个优化的统计量,根据给定的错误率指标估算出统计量的阈 值,使得统计量大于该阈值的基因可被认为是差异表达基因。仿真及真实微阵列数 据上的实验结果验证了该方法的有效性。 在本论文中,差异表达基因被用作样本分类的特征基因。在确定基因是否差异 表达的基础上,为了减少特征基因冗余对样本分类的影响,研究了多种基因约简方 法。约简是基于粗糙集理论的知识发现过程。经典的粗糙集理论建立在等价关系基 础上之上,其结果对数据噪声较为敏感。本论文提出了Spearman秩相关分析、近 似分布约简、区间值分析等基因约简方法。实验结果表明,通过这些方法优化的特 征基因集有效地提高了样本分类的准确率。 微阵列数据的小样本特性给现有的分类算法带来了新的挑战。本文提出了一个 基于主曲线的微阵列数据分类方法。该方法首先在训练数据集上计算出每类样本的 主曲线,然后根据测试样本与各类样本的主曲线间距离的期望方差来确定测试样本 所属的类别。实验结果表明,该方法在处理样本数量偏少的数据集时,较之其他几 种主流分类方法有一定的优势。 关键词:生物信息学,微阵列,差异表达基因,基因选择,多重假设检验,集对比 较优势关系,主曲线 Abstract 博士论文 Abstract the research with richand Microarraysprovidebiological communitytremendously detailedinformationon on datais for geneexpressiondata.Analysismicroarrayhelpful mechanismsand medicinetowardamore future. elucidatingbiological moving predictive of and noise Giventhecharacteristics heavy within needtheassistanceofadvanced data,weurgently computational microarray for and therawinformation. methods utilizing analyzing The data isthe of microarrayanalysisimportanttopicbioinformatics,andidentify aretwo

文档评论(0)

lyxbb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档