基于BP神网络DNA序列分类方法研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

sequences.Thesecondistheperiodicpropertyofthesequences.Thethirdisthat

amountofinformationofthesequences.Byusingthismethod,weclassifythenature

sequencesandartificialsequences.Atlast,weanalyzethecharacteristicinthismodel

andconsiderthegeneralizationofthismodel.

关于序列分类问题的模型

指导老师:

(大连理工大学,大连116024)

编者按:本文以统计方法提取样本特征,以之作为BP神经网络的输入,用

MATLAB中相应算法进行训练。然后用于解决本分类问题,得到了较准确的结果。

本文提取特征时考虑较为全面,在此基础上正确地运用了神经网络方法,发挥了神

经网络适用于非线性问题,具有自适应能力的优点。思路清楚,文字简练。

:本文提出了一种将人工神经元网络用于分类的方法。作者首先应用概

率统计的方法对20个已知类别的人工序列进行特征提取,形成序列的

特征向量,并将之作为样本输入BP神经网络进行学习。作者应用了MATLAB软件

包中的NeuralNetworkToolbox(神经网络工具箱)中的反向(BackpropaionBP)

算法来训练神经网络。在本文中,作者构造了两个三层BP神经网络,将提取的

特征向量集作为样本分别输入这两个网络进行学习。通过训练后,将20个未

分类的人工序列样本和182个自然序列样本提取特征形成特征向量并输入两个网

络进行分类。结果表明:本文中分类方法能够以很高的正确率和精度对

序列进行分类,将人工神经元网络用于序列分类是完全可行的。

1问题重述(略)

序列由四个碱基A、T、C、G按一定规律排列而成.已知所给人工序列1一

10属于A类,11一20属于B类.本题中,我们的主要工作有两个:

1)提取A、B两类特征;

2)以所提取A、B两类特征为依据,把20个人工序列及182个自然序列分为A、

B两类(可能存在同时不具有A、B两类特征,不能归为A、B中任一类的序列)。

在本题中,先以序列1-20为依据,提取出A、B两类序列的统计特征,然后运用神经

网络中的BP网络对未知序列进行了分类识别.

2模型建立的理论依据

神经网络是近年来发展的一种大规模并行分布处理的非线性系统[1],其主要特点有:

1)能以任意精度近任意给定连续的非线性函数;

2)对复杂不确定问题具有自适应和习能力;

3)具有较强的容错能力和信息综合能力,能同时处理定量和定性的信息,能很好

地协调多种输入信息的关系。

传统的分类识别方法,对于一般非线性系统的识别很,而神经网络却为此

了一

个强有力的工具。它实质上是选择了一个适当的神经网络模型来近实际系统。目

前,在神经网络中应用最多的是BP网络。

对于具有个输入节点,个输出节点的BP网络,输入到输出的关系可以看作是

一个维欧式空间到维欧式空间的映射,→,这一映射是高度非线性

映射。K.T.Funahashi于1989年证明了这样的一个定理[2]:如果BP网络隐层节点

可以根据问题的不同作相应的配置的话,那么用三层的激励函数为双曲线正切型的

BP网络,可以以任意精度近任意连续函数。这一定理保证了BP网络在分类识别

问题中的可用性。

将复杂系统看作是一个黑箱,以实测输入,输出数据为学习样本,送入BP网络,

网络通过样本进行学习,在学习过程中,网络的权值不断地修改[3],使输入到输

出的映象逐渐与实际对象的特性相近,但网络输出的整体误差小于给定的标

准时,整个网络便模拟出实际系统的外部特性.

实际分类识别问题中,输入空间一般是欧式空间,我们可以计算空间中点与点

的欧式距离,并根据这些距离知道

文档评论(0)

182****0328 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档