- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DNA进化马尔可夫过程模型的评价与推广@灞麒
遗 传 学报,21(1);17-23,1994
点etaC已neticaSinica
D-%iN}TA进化马尔可夫过程模型的评价与推广①
杨子恒 NickGoldman
(北京农业大学畜牧系 北京 10009勺 (英国国家医学研究所 伦敦)
摘要 本文对 DNA序列进化过程中核苔酸替代的随机模型进行了评价,对替代速率在时间
和空间上不恒定的情形进行了考察与推广。Lanave等(198幻曾提出一个模型,宣称对替代的
模式未做任何假定,但事实上我们证明它假定替代过程是可逆的。运用2-p,4-P和6-p模型
进行的计算表明替代速度在位点间的差异会造成估计的替代数严重偏低,并且替代数越大,
偏差也越大。替代模式在位点间的差异也会造成估计值偏低,但偏差不严重。运用非齐次马
氏过程模型研究了替代速度在时间上的变异,结一y表明估计的替代数反映了速率在时间上的
平均值。文中还讨论了本文结果与进化树推断的关系。
关键词 核苍酸替代,随机过程模型,分子进化
DNA序列资料的飞速积累使得我们可以在 DNA水平上直接研究进化过程。通过
估计同源序列间的进化距离我们可以推断物种间的分化顺序及分化年代。为此,通常假
定核普酸的替代过程为时齐马尔可夫过程,这样序列间的距离,即每位点核营酸替代数就
跟时间呈线性关系。然而,这些模型包含了一些假定ts[.lY}:}1替代速率在进化路径间及
进化路径内都是恒定的。(2)不同位点上的替代速率相等且替代过程独立。(3)没有 正()
选择的作用,即只有消除不利突变、影响替代速率的纯化选择。近来有不少的证据表明这
些假定有时是不现实的2.『3.4.71,可是对于违反这些假定会有什么效果尚缺乏研究。
在上述假定下,齐次马氏过程模型的替代速率矩阵是一个4x4矩阵,有12个自由
参数。为了估计两序列间的进化距离,通常需要对速率矩阵的结构做进一步的约束以减
少未知参数的个数,例如1P参(数)18,1.2_.Df91,4-pIT41及6-p[b1模型即是如此。Lanave
等’。〔,提出的模型I;Ii宣称对速率矩阵未做任何约束,从而为 “最通用的模型”,但事实并非如
此。
本文中我们首先对 Lanave等的模型做一考察,然后对速率在位点上及时间上的变
异的效果进行研究。
盆速率矩阵Q的结构及 Lanav。等f1[3」模型的评价
假定序列中任一位点上核昔酸的替代过程为一时齐马尔可夫过程。以p(t)二p{i,(t)}
表示时间t内的转移概率矩阵,其中p,;0为一位点在时间Q时为i的条件下,时间 !时
为t的概率,i打取值 1,2,3,4,对应 TFC,A,G。这时
Q一P(o)一d(P)(t)!一line(P(t)一1) (1)
ds },二。 不口书 a
i/],1之为速率矩阵,因为 9ji,LIt(r01)表示核营酸i在时间间隔△,内突变为1的概率。
① 本文于 199?}T4H28F]收到
I色 遗 传 学 报 21卷
,,一‘一名,,,-一宁‘
i价 ‘
Q与 P(t)互相唯一决定11〔。且 P(t)一 。of,对Q进行谱系分解 (即对角化)有
呜
Q一艺zduaoa
砚 二 I
其中又:一。,Z2,Z314 。为Q的特征根,而 ua~(Ulau2aU3aufac)‘和Vci~ (。。:va2vaa3Ua4),
为几,所对应的右和左特征向量,并且vau,一61009这样有
弓
P(t)一习 c`l}uova (2)
文档评论(0)