ling_5_神网_进化树.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§ 3.7 神经网络法 § 3.7.1简化的神经元数学模型 § 3.7.2 BP(Back Propagate)神经元网络模型 问题:假设给定了N个样本: {xk, yk}, (k=1,2,…,N) 如何训练网络,使得当输入为xk时,输出尽可能接近yk ? 让我们考虑样板k: 正向传播: 结点 j 的输入应为: 逆向回传(调节连接权重): 用t表征输出层的单元,将期望的输出(准确值)记为 yk = {ytk}, 对应的实际输(预报值)出记为 ?k = {?tk} 。逆向回传就是以期望输出和实际输出的差别(yk - ?k)为依据,来修正网络的连接权重w,之后又进行新一轮的预报。这种迭代过程一遍遍进行,直到平方型误差函数: § 3.7.3 人工神经元网络的基本特征 分布存储和容错性; 大规模并行处理; 自学习、自组织、和自适应性; 具有一般非线性动态系统的特征; 适于处理一些环境信息复杂、知识背景不清楚和推理规则不明确的问题。 § 3.7.4 实例: 用BP网络预测蛋白质二级结构 参考文献: J. Mol. Biol. 202: 865-884, 1988 § 3.8 进化树的构建 § 3.8.1 关于进化生物学 § 3.8.2 生命史的三个阶段 § 3.8.3 进化树的特征和术语 § 3.8.4 分子进化树的构建方法 § 3.8.5 分子进化的局限性 § 3.8.6 进化树的可信度检验 § 3.8.7 突破传统分子进化方法的尝试 3.8.1 关于进化生物学 进化生物学是研究生命的起源及进化的过程、原因、机制、速率和方向的科学。 进化生物学的基础理论就是进化论。 研究生物进化的三个途径:化石纪录,形态比较,大分子比较。 3.8.2 生命史的三个阶段 § 3.8.4 分子进化 § 生物大分子的进化特征 § 分子进化树(phylogenetic tree) 的构建 几个常见建树方法的介绍 可靠性检验 § 常用的免费软件包 § 生物大分子的进化特征 如果以核酸或蛋白质的一级结构的改变(即分子序列中核苷酸或氨基酸的替换数)作为进化改变量的测度,那么生物大分子随时间的改变(即分子进化速率)是相当稳定的,其原因可能是“替换”是一个没有特殊驱动和控制的随机过程。 不同物种同源大分子的进化速率大体相同,如不同动物的血红蛋白分子的进化速率基本上都是k=10-9/aa?a, 即每个氨基酸位点每年替换10-9次。 分子进化方法就是利用上述特点,通过不同物种的同源大分子的比较,来确定物种间的亲缘关系,分支时间,进而定出系统进化树的。 16S rRNA树和三界理论 Woese等人:Proc. Natl Acad. Sci. USA 87, 4576–4579. § 分子进化树的构建 Maximum Parsimony Method Fundamentals of Molecular Evolution pp. 106-111 适用于已经有了严格多序列alignment结果的情况。 例子: 适用于: 物种(序列)相似程度很高的情况。 优点:找到的一定是最优的树(结构), 能推测“祖先”序列。 缺点:当物种(序列)的数目较大时(N13),计算时间太长,所以,可行性很差。 Fitch and Margoliash Method 参考文献:(Science 155: 279-284, 1987) 3. 求出A、C、“复合物种”三者构成的树的分支长度a,c,(复合物种),这时,A、C的“紧邻分支长度已确定”; 4. 将“紧邻分支长度已确定” 的A、C看成一个“复合物种”(AC),计算其它各物种到(AC)的距离,构造出新的(少了一维的)距离矩阵; 5. 按照同样的办法,一遍遍重复2到4的步骤,就可逐步确定出树的整体结构及全部分支长度。 该方法的优点是:不要求物种(序列)的相似程度必须很高,并且计算速度快,能处理物种(序列)数目较大的情况; 缺点是:不能保证找到的是最优的树。 与该方法类似,且目前使用最广的是:Neighbor Joining 方法(邻接法,参考文献:Mol. Biol. Evol. 4: 406-425, 1987),PHYLIP包中的程序“neighbor”采用的就是这种方法。 当物种(序列)的相似程度相当低时,可以采用Maximum Likelihood Method (最大似然法),详见PHYLIP包中的“DNAML”和“DNAMLK”程序及其说明。 § 常用的免费程序包 PHYLIP程序包(Phylogenetic Inference Package) 是目前使用最广泛的系统发生分析程序包,包含几十个分子进化研究的相关程序。 参考

文档评论(0)

msb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8134116003000000

1亿VIP精品文档

相关文档