基于博弈论的可变剪接预测算法分析-analysis of alternative splicing prediction algorithm based on game theory.docxVIP

  • 6
  • 0
  • 约6.41万字
  • 约 63页
  • 2018-05-18 发布于上海
  • 举报

基于博弈论的可变剪接预测算法分析-analysis of alternative splicing prediction algorithm based on game theory.docx

基于博弈论的可变剪接预测算法分析-analysis of alternative splicing prediction algorithm based on game theory

独创性声明本人声明,所呈交的学位(毕业)论文,是本人在指导教师的指导下独立完成的研究成果,并且是自己撰写的。尽我所知,除了文中作了标注和致谢中已作了答谢的地方外,论文中不包含其他人发表或撰写过的研究成果。与我一同对本研究做出贡献的同志,都在论文中作了明确的说明并表示了谢意,如被查有侵犯他人知识产权的行为,由本人承担应有的责任。学位(毕业)论文作者亲笔签名:日期:论文使用授权的说明本人完全了解福建农林大学有关保留、使用学位(毕业)论文的规定,即学校有权送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。保密,在年后解密可适用本授权书。□ 不保密,本论文属于不保密。□学位(毕业)论文作者亲笔签名:日期:指导教师亲笔签名:日期:目录摘要IAbstractII第一章绪论11.1 研究背景及意义11.2 国内外研究现状11.3 本文主要研究内容及组织结构3第二章可变剪接预测基本流程与数据样本描述52.1 可变剪接预测基本流程52.1.1 可变剪接简介52.1.2可变剪接预测基本流程62.2 数据样本描述8第三章基于博弈论的可变剪接预测模型113.1 传统的特征选择方法113.1.1 特征选择的一般过程113.1.2 自下而上和自上而下的特征选择123.2 基于博弈论的特征选择方法143.2.1 基于夏普利值的特征选择153.2.2 基于静态博弈的特征选择173.3 改进的博弈论特征选择模型193.3.1 基于重复-动态博弈的特征选择193.3.2 使用模糊聚类法提取博弈模型参与人243.3.3 参与人间的重复-动态博弈26第四章分类方法的选择294.1 分类方法的选取标准294.2 朴素贝叶斯分类器304.2.1 朴素贝叶斯模型304.2.2 实验结果314.3 支持向量机324.3.1 支持向量机模型324.3.2 实验结果344.4 Softmax回归354.4.1 Softmax回归模型354.4.2 梯度下降法求解模型参数364.4.3 实验结果374.5 选择分类方法37第五章可变剪接预测结果及分析415.1 基于重复-动态博弈模型的分类预测结果415.2 结果分析425.2.1 分类准确率方面425.2.2 特征选择方面43第六章总结与展望45参考文献47附录51致谢57摘要人类基因组测序工作初步结果显示,人类基因数量不是之前预计的8至10万个,而只有大约3.5万个,活细胞使用这些基因来产生更有活力且更加充裕的指示源。可变剪接现象是活细胞具有惊人多样性的很好解释,因此发展生物信息学方法进行可变剪接研究显得尤为重要。本文通过分析现有的一些特征选择方法,发现其存在的特征选择单方向、不适用于高维特征数据、容易出现错漏选、缺乏的有效补充机制等问题。针对这些问题,提出了改进的基于重复-动态博弈的可变剪接预测模型,它实际上是一种filter和wrapper结合的特征选择模型。该模型利用了动态博弈和重复博弈的思想,使用模糊聚类法提取博弈模型的参与人,将自上而下和自下而上相结合,并根据模型特点,选择了具有高效率且比较依赖特征选择的朴素贝叶斯作为分类器。经过对比多种现有的分类方法和特征选择方法,本文得出以下结论:对于本研究所使用的可变剪接数据,对比其他一些方法,基于重复-动态博弈的可变剪接预测模型具有最高的分类准确率;在特征选择方面,重复-动态博弈特征选择耗时最短、使用的分类次数最少、特征选择机制更加优秀。根据重复-动态博弈预测模型训练出的预测器,只要给定组织类型以及可变外显子的特征向量,即可预测出可变外显子在该组织中的可变剪接结果。关键词:可变剪接;预测;博弈;特征选择;分类AbstractPreliminaryresultofhumangenomesequencingshowsthatthenumberof humangenesisnot80,000-100,000expectedbefore,butonlyabout35,000.Living cellsusethesegenestoproducemoreabundantandmoredynamicindicationsource. Thephenomenonofalternativesplicingisagoodexplanationthatlivingcellshave amazingdiversity,therefore,developingbioinformaticsmethodsforalternative splicingstudyis particularlyimportant.Byanalyzingsomeoftheexistingfeatureselectionmethods,paperfoundtheir

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档