基于单核苷酸统计和支持向量机集成人类基因启动子识别.docVIP

  • 1
  • 0
  • 约1.17万字
  • 约 18页
  • 2018-08-29 发布于福建
  • 举报

基于单核苷酸统计和支持向量机集成人类基因启动子识别.doc

基于单核苷酸统计和支持向量机集成人类基因启动子识别

基于单核苷酸统计和支持向量机集成人类基因启动子识别   摘要:为高效地判别人类基因启动子,提出了一种基于单核苷酸统计和支持向量机集成的人类基因启动子识别算法。首先通过基因单核苷酸统计,从而将一个基因数据集分为C偏好和G偏好两个子集;然后分别对这两个子集提取DNA刚性特征、词频统计特征和CpG岛特征;最后采用多个支持向量机(SVM)集成的方式来学习这三种特征,并讨论了三种集成方式,包括单层SVM集成、双层SVM集成和级联SVM集成。实验结果表明所提算法能够提高人类基因启动子识别的敏感性和特异性,其中双层SVM集成的敏感性达到79.51%,且级联SVM集成的特异性高达84.58%。   关键词:CpG岛; DNA刚性; 人类启动子识别; KL散度; 单核苷酸统计; 支持向量机   中图分类号: TP3-05;TP301.6   文献标志码:A   Abstract: To efficiently discriminate the promoter in human genome, an algorithm for human promoter recognition based on single nucleotide statistics and Support Vector Machine (SVM) ensemble was proposed. Firstly, a

文档评论(0)

1亿VIP精品文档

相关文档