ling_8_新技术方法.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 一些新的技术和方法 § 4.1 复杂度计算方法 § 4.2 分形分维的方法 § 4.3 马尔科夫链(Markov Chain)方法 § 4.4 隐含马尔科夫模型(HMM)简介 § 4.5 Bayes (贝叶斯)公式的应用 …… § 4.1 复杂度计算方法 参考文献: [1] IEEE Transactions on Information Theory 22(1): 75-81, 1976 [2] Physical Review, A 36(2): 842-848, 1978 [3] 科学通报 38(21): 1995-1997, 1993 § 4.1.1 不同学科关于“复杂”的定性定义 生命科学:如何解释生物分子结构可能性的天文数字和实际中的有限数量以及脑的功能和结构,这和信息量的定义直接相关; 计算机算法:如果一个问题用较短的计算机语言能解决,则认为“复杂度”小,反之“复杂度”大; 动力学:平衡态,定态,稳态,周期运动等等都是有序有结构的,并不复杂;而当动力学系统的运动进入混沌的时候,就成了复杂系统了。 § 4.1.2 一维序列的复杂度定量算法 设有一长度为 n 的一维字符序列: (x1x2 x3x4x5x6x7x8 x9…..xn) 可以通过一定的规则将之划分为一个个的“新pattern”: (x1?x2?x3x4?x5?x6x7x8?x9…xn), 则这些“新pattern”的数量 m 就定义为这个字符序列的复杂度,记为C(n)=m。 所谓“新pattern”就是不可由已有的patterns顺序组合而成的pattern。 注意:最后一个pattern不管新旧都算数。 几个名称(概念): 称带有分段符‘?’的序列为T, 例:T = x1?x2?x3x4?x5?x6x7 由其中已确定的 patterns (T中最后一个分段符‘?’以前的patterns)直接相连形成的序列记为S, 例: S= x1x2x3x4x5 新的,尚未确定的pattern记为Q,例:Q= x6x7 S加上Q记为SQ,即去掉‘?’后的T 例: SQ= x1x2x3x4x5x6x7 SQ去掉最后一个字符记为 SQv, 例: SQv= x1x2x3x4x5x6 若 Q 不是 SQv 的子串,则认为Q形成一个新的pattern,这时在其右边插入‘?’,原来的SQ变为新的S,而其右边紧临的(尚未考虑的)一个字符成为新的Q; 从新的Q(和新的S)得出新的T、SQ和SQv,再重复同样的检测,一直到全序列的最后一个字符。 最后一个pattern总看成新的。 示例:计算序列 0010 的复杂度: 从左到右考察每一个字符: 第一个字符永远是新的pattern, 所以,T=0? S=0, Q=0, SQ=00, SQv=0, Q是SQv的子串,所以,T=0 ?0 S=0, Q=01, SQ=001, SQv=00, Q不是SQv的子串,所以,T= 0 ?01 ? S=001, Q=0, SQ=0010, SQv=001, Q是SQv的子串, T= 0 ?01 ?0 所以,C(4)=3,即序列 0010 的复杂度的是3。 注意: 最后一个pattern不管是否“新”, 都记入复杂度。 § 4.1.3 相对复杂度 根据Lempel和Zip的研究,对于字符集A上的随机序列,其复杂度都趋于同一极限: § 4.1.4 实例:蛋白质基因不同区域的复杂度 § 4.2 分形分维的方法 参考文献: J. Theor. Biol. 119: 316, 1986 Nature 314:585, 1985 J. Theor. Biol. 175: 23-26, 1995 § 4.2.1 分形学的由来 许多自然物体如树、海岸线、云彩等都有类似的性质。 在欧氏几何中,我们用一些基本元素如点、直线、圆等来描述物体;在分形几何中,代替这种“基本元素”的是几何语言(算法和数学程序集)。 IBM公司的数学家 Benoit B. Mandelbrot 于1975年创造了“fractal ”这个词,来源于拉丁文,含有“碎化、分裂”之意,并于1982年写出了《The Fractal Geometry of Nature》一书,从此,分形学成为一门生机勃勃的学科。 § 4.2.2 分形的一些性质 具有无限精细的结构; 比例自相似性; 可以通过一

文档评论(0)

msb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8134116003000000

1亿VIP精品文档

相关文档