- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第21卷第 2期 海南师范大学学报 (自然科学版) Vo1.21 No.2
2008年6月 Journal of Hainan Normal University(Natural Science) Jun.2008
生物信息学中两条DNA序列比对的计数
刘 兵,李大超
(海南师范大学数学系,海南海口571158)
摘 要:应用组合数学的技巧研究了两个序列比对的计数问题.根据已知两个长度分别为
、 m的DNA序列比对的递归公式.利用发生函数求出了两序列比对数的表达式.
关键词:生物信息学;序列比对;递归公式;发生函数
中图分类号:0 157 文献标识码:A 文章编号:1671—8747(2008)02—0139—04
在生物信息中序列比对是最重要、最常用的原始操作。是许多其他更复杂操作的基础.序列的比对是
将两条或多条核酸序列或蛋白质序列进行对比.用它们之间的相似程度来研究序列间的功能和结构的相
似性以及生物进化史.通过序列对比的研究。科学地证实了黑猩猩和人有最近的共同祖先;鸟的翅膀和蝙
蝠的翅膀都是独立进化而来的.这些实例已经说明了序列比对的作用是相当大的.本文主要研究了两条
DNA序列的比对计数问题.
计数问题在生物信息学中应用广泛.如RNA的计数问题 等。而序列比对是生物信息学中进行序列
分析的一个常用工具,通过序列比对可以探索生物序列中包含的功能、结构、控制和进化信息[3],序列比对
计数问题就成为生物信息学中的一个重要问题.本文给出了序列比对的简要组合处理,生物学提出了比对
序列的动机。估计序列比对个数则成为数学任务.这个结果在负面意义上对生物学有用:它肯定了存在巨
大数量的比对。并且直接枚举是没有希望的.
1 基于动态规划方法的序列比对介绍
设a=a1a2… 和b=blb …bm是两个长分别为n和m的序列.比对的一种方法是当空元素“一”插入
序列时,产生一个比对,插入“一”的目的是使新的序列有相同的长度 .然后写出两个序列,一个在另一个
上面.当插入“一”时,口=口 a2… 变为口=口 …aL ,而b=b b …bm变为b =6 6 ·6:.口 和b 的非 “一”
元素的子序列是原来的序列.比对是
● ● ● ●
a a1 a2… ’
b =b1 b2…b .
为了弄清楚这个过程。设a=TATFCG和b=rrIT兀GC.为得到一个比对,在众多的可能之中考虑a‘=
一 TA1TrCG一和b =Ⅲ 一GC.则由上述描述可知,b1=T,b6=“一”以及b7=G,而b1=T,b6=G.b7=
C.比对写成
a =一TATTCG一 .
b :rrI1_IT—GC.
收稿日期:2008-01-20
基金项目:海南省自然科学基金项目(807052)
140 海南师范大学学报(自然科学版) 2008年
这里, = 与b:=T匹配形成一个等同, =A与 = 形成一个失配.本文的核心问题就是有多少种
方法将口与b比对.不允许两个“一’’相匹配,因为这样没有任何可比的意义. 因此显然有ma】【In,m】≤三≤
+m.L= +m的情况是
“1“2… … ‘一
… · 一 b1 b2…b
由组合数学知识易知,两个序列比对以下列三种方式之一结束. 即
…
文档评论(0)