网站大量收购闲置独家精品文档,联系QQ:2885784924

信息论与生命科学解读.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息论与生命科学解读

信息论与生命科学 首先研究输入信源X3,输入信源是遗传密码的集合,它就是碱基信源的3次扩展信源,X的符号集为A={A,G,C,U},对于不同的生命体,碱基符号集的分布是不同的。根据L.L.Gatlin 对60多种机体中的DNA和mRNA的碱基序列 统计分析研究,确定了碱基序列并非是统计独立的。它们之间是由依赖的,可以证实它们是 一阶Markov信源。通常还假设它具有时齐性和遍历性。 由于信源X3是一阶Markov信源的三次扩展信源,因此,信源X3也是一阶Markov信源信源X3的符号集为A3={x1x2x3,xi∈A,i=1,2,3},其个数为64个,所以遗传信道的输入信源为: 生命机体在遗传信息传输过程中具有一定的 抗干扰能力,从信息论的角度看,增加信源 的剩余度可以提高信道的抗干扰能力。因此 DNA的碱基序列中不但存储遗传密码,指导 蛋白质合成,而且还存储着较为复杂的“遗传 语言”,控制遗传正确地进行。人们的实验研究 证明确实如此。 Gatlin研究和确定了60多种机体内DNA和mRNA的碱基序列是一阶Markov链,另外有人对个别噬菌体的DNA序列的研究,证实了它的碱基序列至少是二阶Markov链。 为了分析碱基序列的剩余度,Gatlin引进了 两个偏离指标:一阶偏离指标D1,表示与等概率分布信源的偏离。 * 1.DNA到蛋白质的通信系统 遗传学认为每种生命都具备一个储存 和处理信息的系统,以便在它们代代相传和发展的过程中能准确地复制自身。 现在已基本确定脱氧核糖核酸(DNA)是遗传的物质基础。 遗传信息储存在DNA的结构中。 DNA有两个螺旋形结构,是由一系列核苷酸绕某一长中心轴形成的螺旋梯状结构。每个核苷酸所含的碱基不同,由四种碱基配对联接。每个生命系统的DNA中都有它们各自的特定的由4个碱基排列而成成的碱基序列长链。 不同的碱基序列形成不同的DNA分子,形成不同 的生命体。从信息论的观点来看DNA分子中的4种 不同的碱基相当于将遗传信息编成“密码”的4 个“字母”,即遗传信息源中的4个“字母”这 遗传信源的符号表为: 元素符号 a1 a2 a3 a4 碱基符号 A G C T 碱基名称 腺嘌呤 鸟嘌呤 胞嘧啶 胸腺嘧啶 由这“字母”表中的字母排列成不同的字母序列就组成核苷酸系列,也就组成了不同的 DNA结构。所以遗传密码就是记载在亲代DNA 分子核苷酸序列上的遗传信息,而DNA分子中 的特定的核苷酸顺序就决定了生物体的遗传 性状。 实验表明,DNA的碱基序列是非常长的。因此 遗传信源总共可能有不同碱基序列的总数较大。 据估计人类基因的数目在2.6万到3.9万。虽然 比原先估计的10万要低,但是对于DNA作为遗传 信息的存储系统来说,它的信息容量还是很大。 生物生长过程经常要发生DNA的复制。只有遗传信息快速准确地复制和传递才能保证生物性状 的继承和再现。DNA的复制过程是:亲代DNA的两条长链被打开,每条核苷酸链作为模板,在周围、充满与4种碱基相对应的三磷酸底物中,不断提供核苷酸与模板中的核苷酸按互补原则配对形成新的DNA链。互补配对原则是腺嘌呤(A)与胸腺嘧啶(T)配对,鸟嘌呤(G)与胞嘧啶(C)配对. 这个复制的信息传递过程可以看成是一个输入和输出的单向、单符号的信息传递。 信道的输入信源为X,x∈A={a1=A,a2=G,a3=C,a4=T} 输出端为Y,y∈B={b1=A,b2=G,b3=C,b4=T} 根据核苷酸互补配对原则,有: P(b4|a1)=1,P(b3|a2)=1,P(b2|a3)=1,P(b1|a4)=1 其余P(bj|ai)=0。 可用概率空间[X,P(bj|ai),Y]来描述DNA的复制 过程,其复制矩阵信道为: 从生物学知道,蛋白质是生命的基本物质,它 由20种不同的氨基酸以各种方式排列而成的,不同的氨基酸的排列组合构成不同的蛋白质。另外, 现在又认为不同的蛋白质分子是按照DNA的分子结构来合成的。也就是按照DAN传递出去的遗传信息合成的。由前分析,遗传信息存储在这4中碱基的序列中,问题是:怎样将DNA中的遗传信息传递到合成的蛋白质分子中去? 蛋白质在生物体内的合成需经转录和翻译两个 阶段。转录是按照DNA的模板生成带遗传信息的单链核糖核酸,称为信使核糖核酸。记为mRNA。 它的基本结构也是4种核苷酸配对联接的长链,但与DNA不同的是以尿嘧啶(U)替代胸腺嘧啶(T). 这个转录过程也可认为是一个单向、单符号的信息传输信道,信道输入端符号集为{A,G,C,T},输出端符号集为{A,G,C,U},根据它们

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档