Statistical Properties of DNA Sequences.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Statistical Properties of DNA Sequences.ppt

Statistical Properties of DNA Sequences 東海大學物理系?施奇廷 2005/5/15 生物物理 生物學家最感興趣的:基因圖譜 Music of Life 將流行性感冒病毒之DNA序列轉換成樂譜: Z Curve R. Zhang, and C. T. Zhang J. Biomol. Struc. Dynamics 11, 767-782. 核苷酸的三種特性 嘌呤(A, G) vs 嘧啶(C, T) 強鍵(C, G) vs 弱鍵(A, T) 氨基(A, C) vs 酮基(G, T) 什麼是「Z 曲線」? 對於任何一個DNA序列,若由第一個到第n個鹼基中,A, T, C, G出現的個數各為 An, Tn, Cn, Gn 例如以下序列:AATTGCATCCCGAGG,則( An, Tn, Cn, Gn )為: n=1:(1,0,0,0) n=5:(2,2,0,1) n=10:(3,3,3,1) n=15:(4,3,4,4) 什麼是「Z 曲線」? 接著定義三維座標 Rn=(xn, yn, zn),其中xn, yn, zn定義為: xn=2(An+Gn)-n yn=2(An+Cn)-n zn=2(An+Tn)-n 以前述序列為例AATTGCATCCCGAGG : n=1:(1,0,0,0)→ Rn=(1,1,1) n=5:(2,2,0,1) → Rn=(1,-1,3) n=10:(3,3,3,1) → Rn=(-2,2,2) n=15:(4,3,4,4) → Rn=(1,1,-1) Z曲線的意義 xn=2(An+Gn)-n → xn0 表嘌呤類較多,嘧啶類較少 yn=2(An+Cn)-n → yn0 表氨基類較多,酮基類較少 zn=2(An+Tn)-n → zn0 表弱鍵結較多,強鍵結較少 若有一序列總長度為 N,則可以由以上定義算出Rn(N=1,2,3……,N),並在三維空間中畫出軌跡 亦可將足標n視為「時間」,畫出x(n),y(n),z(n) 大腸桿菌之Z曲線 DNA Walk C.K. Peng et al. Nature 356, 168 (1992). Random Walk 什麼是「無規行走」(Random Walk)? 一維:丟一枚銅板,出現正面則向前一步,出現背面則向後一步 二維:丟兩枚銅板,出現「++」則向前、「+-」向後、「-+」向左、「--」向右 如果沒有作弊,平均而言,走過很多步以後,會回到原點附近 但是不會剛好回到原點,而是在距離原點√N的範圍之內 寫成數學表示法:Y(N)=0± √N。若把標準差寫為 F(N),則 F(N)= √N 或 N0.5 利用電腦程式模擬看看: DNA Walk 如果我們不用丟骰子的方式來決定往哪個方向走,而是利用 DNA 序列來決定,結果如何? 一維 DNA walk 方法:依序讀入 DNA 序列,如果讀到 C, T (嘧啶)則向前一步,如果讀到 A, G(嘌呤)則向後退一步 二維 DNA walk 方法:四種核甘酸剛好對應四個方向 麵包酵母菌第三及第八條染色體之一維 DNA Walk 麵包酵母菌第二條染色體之二維 DNA Walk 關於一維 Walker 的分析 比較三種「走法」:前兩種是我們前面介紹過的 Random walk 以及 DNA walk 第三種是 Fibonacci walk: 利用所謂的 Fibonacci 數列方法產生一個「假的」DNA 序列 由 G 開始→G 變成 GC→G 變成 GC,C 變成G(GCG)→GCGGC→GCGGCGCG…… 產生出來的序列再用 DNA walk 的方法去走,得到下圖 DNA Walk (conti.) Fluctuations: Correlation: Random sequence and short correlated sequence: Long-range correlated sequence: 關於一維 Walker 的分析(續) 由 F(N)=Na 的行為看來,這三種序列有很大的不同: Random walk: a = 0.5 Human Ch22: a ~ 0.6 Fibonacci: a 0.5 Random walk 裡面不含資訊(全是隨機亂數),因此 a=0.5 表示「資訊量最低」 Fibonacci 序列有嚴謹的規則,所以 a 偏離 0.5 很遠 DNA ? DNA Walk (conti.) intron-containing b-cardiac myosin (● with a=0.67) and its cDNA (○ with a=0.49) intron-rich genes (● with a=0.62) and its intr

文档评论(0)

gshbzl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档