生物序列新的图形表示与其应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物序列新的图形表示及其应用 0前言 随着人类基因组计划(HGP)实施的进一步深入,生命科学己经步入后基因时 代。基因和蛋白质已经成为现代生命科学的主要研究对象。过去,生物科学家们 研究单个基因或蛋白质,现在和将来,科学家们将着重研究DNA序列信息、蛋 白质结构信息,以及它们之间的相互作用。破译每一水平的生物信息提出了与基 因或蛋白质有关的统计和组合数学问题,生物信息的急剧增长也带来了对计算机 科学的挑战。为此,计算分子生物学和生物信息学便应运而生。 广义地说,生物信息学是对生物信息的获取、加工、储存、分配、分析和释 读,并综合运用数学、信息科学、计算机科学、系统科学和生物工具,以达到理 解数据库中各种数据的生物学含义的目的。与此对应,生物信息学具有三方面的 科学基础:首先,它需要发达的、复杂的、可相互交流的数据库系统;其次,生 物信息学需要强有力的创新算法和软件来获得持续的发展;最后也是最重要的是 生物信息学需要一个大规模、高通量的生物学研究方法和平台技术,这些技术既 是生产生物信息数据的主要方法,又是在利用生物信息分析结果的基础上进一步 获取或验证生物学知识的关键。 生物信息学是计算分子生物学的“孪生”学科。人们常常不加区别的使用这 两个学科名称。严格来讲,生物信息学还包括对各种生物信息存储和查询的研究。 molecular 计算分子生物学(computationalbiology)是-f7崭新的交叉学科,主 要是研究分子生物学应用上具有计算复杂度的问题,它吸引了许多计算机科学 家、分子生物学家、数学家和物理学家投入研究。计算分子生物学的研究对象是 与基因和蛋白质序列有关的组合和计算问题,计算分子生物学的主要课题有:序 列组合、序列分析、生物信息资料库、基因认定、种族树的构建以及分子结构预 测等。 传统的序列(DNA、RNA和蛋白质)是用字母表示,它在发表、存储和提 供计算机进行快速分析等方面具有不容争议的优点,因而被广泛使用,但它也存 在以下缺陷:1.忽视了人脑在模式识别方面的强大能力。2.它的“解象力”不 能调节。随着计算复杂度的增加和可视化技术的发展,序列的字母形式不能满足 人们的多种需要。近几年,不少学者打破了DNA序列的4字母表示的传统,给 生物序列新的图形表示及其应用 出了一系列DNA序列的图形表示,但是这些表示都还有各自的缺陷,主要表现 在以下几点:(1)有退化现象和DNA序列信息丢失现象。(2)对完整序列而言,使 用的数学变量计算太复杂。(3)图形不可调节且RNA和蛋白质涉及极少。(4)图形 表示的应用研究还比较少。我国著名理论物理学家张春霆院士也提出了一种 DNA几何图形表示一Z曲线,Z曲线是表示DNA序列的一个等价的三维空间曲 线。通过对Z曲线的研究来对基因组序列进行研究是一种几何学的途径。天津 大学生物信息中心用这种思路研究了真核和原核基因组中若干重要问题,这样的 思路是切实可行的。原则上说,基因组中的许多问题都可以通过这种途径加以解 决,这种独树一帜别开生面的研究思路已经得到国内外学术界的普遍好评和认 可,越来越多的理论生物学家加入到对Z曲线的研究的行列中来。可以预期, 用几何学方法研究基因组将会有一个广阔的发展空间。 本文分别给出生物DNA和RNA序列的新的图形表示,并基于图形表示进行 应用研究。 2 生物序列新的图形表示及其应用 1分子生物学知识概论 生命的基本单位是细胞,它是由细胞膜、细胞质和细胞核三者组成的。遗传 信息储存在细胞核中,人的细胞核含有23对染色体,染色体包含DNA(脱氧核 糖核酸)和蛋白质,DNA经螺旋、扭曲、折叠等压缩后与蛋白质一起组成染色体。 DNA、RNA和蛋白质都是由更小的单元组成的无分支的线性聚合体大分子。 核苷酸残基;对于RNA,这些单位是A、C、G和U(尿嘧啶)四种核苷酸残基, 对于蛋白质,这些单位是A(丙氨酸)、C(半胱氨酸)、D(天冬氨酸)等20种氨基酸 残基。在相当大的程度上,DNA、RNA和蛋白质分子化学性质编码在这些基本 单元的线性序列(本原序列)中。 1.1DNA、RNA和蛋白质 DNA(

您可能关注的文档

文档评论(0)

lh2468lh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档