基于Fisher线性判别的基因分类器的设计.docVIP

  • 11
  • 0
  • 约3.62千字
  • 约 8页
  • 2018-10-17 发布于山东
  • 举报

基于Fisher线性判别的基因分类器的设计.doc

基于Fisher线性判别的基因分类器的设计.doc

实验一:基于Fisher线性判据的基因分类器的设计 樊瑞元 S200602162 PAGE 8 基于Fisher线性判别的基因分类器的设计 2000年6月人类基因组计划正式完成对人类分布在细胞核中的23条染色体的6万到10万个基因,大约30亿个碱基的测序工作,其中我国完成对3号染色体上的3000万个碱基的测序。基因草图是由4个字符A、T、C、G按一定顺序排列组成的长约30亿的序列,其中没有断句,也没有标点。除了知道这四个字符代表四种碱基之外,人类对基因知之甚少。但众多的科研工作者发现,NDA的序列中隐藏这重大的秘密,关系到人的生老病死,对基因的研究具有重大的意义。 本文对DNA中的四种碱基:腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)和胸腺嘧啶(T)在基因链中出现的频率作为输入向量的四个特征成员,用Fisher线性分类方法对已知类别的20个基因样本进行训练和测试,表明Fisher线性分类方法能对这些已知类别的DNA序列达到分类的目的。 本文采用的数据来自参考文献[1],数据表1所示: 显然表1中的样本共分为两类,其中的为一类,在神经网络中以输出为“1”表示;的为另一类,在神经网络中以输出为“0”表示。 Fisher线性判别: Fisher线性判别的基本思想是将维空间中的样本投射到一维空间中的一条直线上,将维度由多维压

文档评论(0)

1亿VIP精品文档

相关文档