基于机器学习的miRNA靶标预测方法.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于机器学习的miRNA靶标预测方法.pdf

基于机器学习的miRNA 靶标预测方法1 1 1 刘辉 ,张林 ,徐钊 1 中国矿业大学信息与电气工程学院,江苏徐州 (221008) E-mail:lhcumt@ 摘 要:microRNA (miRNA )是一类长约20 个核苷酸(nt )的非编码的调控小分子RNA , 能够切割靶mRNA 或抑制靶mRNA 合成蛋白质的过程,因而对后转录调控有非常重大的作 用。正确地预测miRNA 的靶基因已经是业界研究的热点之一。本文提出一种新的基于统计 理念的学习方法进行miRNA 靶标判别特征的提取,再使用SVM 分类器进行miRNA 靶标的 预测。经仿真结果表明,该方法能够比目前已有的基于机器学习的 miTarget 算法获得更佳 的性能。 关键词:microRNA 靶标预测 生物信息学 SVM 分类器 中图分类号:TP181 1.概述 miRNA 是一类长度约为20nt 的5’端带磷酸基团、3’端带羟基的非蛋白编码的调控小分 子RNA ,不具备ORF,不编码蛋白质,由一段具有发卡环结构的长度为70~80 nt 的单链 RNA 前体剪切后生成。通过mRNA 的3’端非翻译区(3’UTR )的非完全互补配对抑制蛋白 质的合成或完全互补配对切割靶 mRNA ,从而对生长发育进行后转录调控作用。因此,识 别miRNA 调控的基因靶标对于理解其生物功能有着非常重大的意义[1,2] 。目前,比较流行的 miRNA 靶标预测算法有TargetScan,miRanda 和PicTar 。但实际上它们沿袭了相似的方法和 理念,并且都是基于已有的人类对miRNA 及其靶标的认知。基于机器学习的miTarget 算法 [3],不完全依赖于人类已有认知,但其预测性能还有待提高。因此本文提出一种新的基于统 计理念的学习方法进行判别特征的提取,再使用SVM 分类器[4,5]进行miRNA 靶标的预测。 首先,建立样本数据集,包括靶标的3’UTR,314 对经实验验证配对正确的miRNA 和 结合位点配对以及186 对非正确配对的miRNA 和结合位点配对。非正确的miRNA 序列配 对通过将基因let-7 和lin -14 中实际的靶标区域屏蔽而得到。其次,为了实现SVM 判别, 基于样本数据和对miRNA 绑定的已有认知,提取46 个特征。最后,通过SVMlight[6]训练并 优化SVM,进行测试数据集的判别评估其性能。 2 .实现方法 2.1 样本数据集的创建 [7] miRNA 及其配对靶标的序列均是从TarBase 下载 ,一共可以得到314 对经试验验证正 确配对的序列对。正确的miRNA 配对核苷酸包括G-C 配对、A-U 配对和G-U 配对。 事实上,miRNA 在目标序列的绑定区域被剪切掉的情况下无法抑制其靶标的表达水平。 因此,为了产生非正确配对的 miRNA 和结合位点序列对,我们首先将 let-7:lin-14 和 lin-14:lin-28a 两对miRNA 和结合位点的序列中的绑定区域屏蔽掉。然后,我们采用一个30nt 的滑动窗口来依次观察序列,找出其位于窗口中分段与miRNA 的种子区域完全配对的核苷 酸对个数超过连续4 个nt 的序列。种子区域通常被定义为miRNA 的第一到第八个核苷酸。 这样我们得到了186 对非正确配对的miRNA 和结合位点序列对。 从而,本文构建的样本数据集包括314 对经实验验证配对正确的miRNA 和结合位点配 1本课题得到中国 “国家建设高水平大学公派研究生项目”的资助。 -1- 对以及 186 对非正确配对的miRNA

文档评论(0)

lizhencai0920 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档