网站大量收购闲置独家精品文档,联系QQ:2885784924

计算机在生物信息学中应用.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机在生物信息学中应用 【摘要】生物信息学是一门新兴的、正在迅速发展的交 叉学科,它不仅对认识生物体的起源与进化研究有重要意 义,而且还可以为人类诊断疾病及物种的改良提供一定的理 论依据。生物研究过程中产生的海量数据又需要具有数据处 理和分析能力的大容量、高性能的超级计算机的支持, 理和分析能力的大容量、 高性能的超级计算机的支持, 因此 计算机技术在生物信息学的研究中显得尤为重要,本文就简 单介绍了计算机在生物信息学研究中的哪些方面起到了不 可忽略的作用 【关键词】生物信息学;计算机科学;基因组学 生物信息学是利用计算机为工具,用数学及信息科学的 理论和方法研究生命现象,对生物信息进行收集、加工、存 储、检索和分析的科学。生物信息学的核心是基因组信息学, 基因组学是研究生物基因组和如何利用基因的一门学问,该 学科提供基因组信息以及相关数据系统,试图解决生物、医 学和工业领域的重大问题。对于基因组学研究所产生的大量 数据必须借助于先进的计算机技术收集和分析处理这些生 物学信息,因此计算机科学为生物信息学的研究和应用提供 了非常好的支撑。 1.序列比对 序列比对其意义是从核酸、氨基酸的层次来比较两个或 两个以上符号序列的相似性或不相似性,进而推测其结构功 能及进化上的联系。研究序列相似性的目的是通过相似的序 列得到相似的结构或功能,也可以通过序列的相似性判别序 列之间的同源性,推测序列之间的进化关系。序列比对是生 物信息学的基础,非常重要。 序列比对中最基础的是双序列比对,双序列比较又分为 全局序列比较和局部序列比较,这两种比较均可用动态程序 设计方法有效解决。在实际应用中,某些在生物学上有重要 意义的相似性不是仅仅分析单条序列,只能通过将多个序列 对比排列起来才能识别。比如当面对许多不同生物但蛋白质 功能相似时,我们可能想知道序列的哪些部分是相似的,哪 些部分是不同的,进而分析蛋白质的结构和功能。为获得这 些信息,我们需要对这些序列进行多序列比对。多重序列比 对算法有动态规划算法、星形比对算法、树形比对算法、遗 传算法、模拟退火算法、隐马尔可夫模型等, 传算法、 模拟退火算法、 隐马尔可夫模型等, 这些算法都可 以通过计算机得以解决。 2 ?数据库搜索 随着人类基因组计划的实施,实验数据急剧增加,数据 的标准化和检验成为信息处理的第一步工作,并在此基础上 建立数据库,存储和管理基因组信息。这就需要借助计算机 存储大量的生物学实验数据,通过对这些数据按一定功能分 类整理,形成了数以百计的生物信息数据库,并要求有高效 的程序对这些数据库进行查询,以此来满足生物学工作者的 需要。数据库包括一级数据库和二级数据库,一级数据库直 接来源于实验获得的原始数据,只经过简单的归类整理和注 释;二级数据库是对基本数据进行分析、提炼加工后提取的 有用信息。 分子生物学的三大核心数据库是GenBank核酸序列数据 库,SWISS-PROT蛋白质序列数据库和PDB生物大分子结构数 据库,这三大数据库为全世界分子生物学和医学研究人员了 解生物分子信息的组织和结构,破译基因组信息提供了必要 的支撑。但是用传统的手工分析方法来处理数据显然已经无 法跟上新时代的步伐,对于大量的实验结果必须利用计算机 进行自动分析,以此来寻找数据之间存在的密切关系,并且 用来解决实际中的问题。 3.基因组序列分析 基因组学研究的首要目标是获得人的整套遗传密码,要 得到人的全部遗传密码就要把人的基因组打碎,测完每个小 的序列后再把它们重新拼接起来。所以目前生物信息学的大 量工作是针对基因组DNA序列的,建立快速而又准确的DNA 序列分析方法对研究基因的结构和功能有非常重要的意义。 对于基因组序列,人们比较关心的是从序列中找到基因及其 表达调控信息,比如对于未知基因,我们就可以通过把它与 已知的基因序列进行比较,从而了解该基因相关的生理功能 或者提供疾病发病机理的信息,从而为研发新药或对疾病的 治疗提供一定的依据,使我们更全面地了解基因的结构,认 识基因的功能。因此,如何让计算机有效地管理和运行海量 的数据也是一个重要问题。 4?蛋白质结构预测 蛋白质是组成生物体的基本物质,几乎一切生命活动都 要通过蛋白质的结构与功能体现出来,因此分析处理蛋白质 数据也是相当重要的,蛋白质的生物功能由蛋白质的结构所 决定,因此根据蛋白质序列预测蛋白质结构是很重要的问 题,这就需要分析大量的数据,从中找出蛋白质序列和结构 之间存在的关系与规律。 蛋白质结构预测分为二级结构预测和空间结构预测,在 二级结构预测方面主要有以下几种不同的方法:①基于统计 信息;②基于物理化学性质;③基于序列模式;④基于多层 神经网络;⑤基于图论;⑥基于多元统计;⑦基于机器学习 的专家规则;⑧最邻近算法。目前大多数二级

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档