- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机在生物信息学中应用
【摘要】生物信息学是一门新兴的、正在迅速发展的交 叉学科,它不仅对认识生物体的起源与进化研究有重要意 义,而且还可以为人类诊断疾病及物种的改良提供一定的理
论依据。生物研究过程中产生的海量数据又需要具有数据处
理和分析能力的大容量、高性能的超级计算机的支持,
理和分析能力的大容量、
高性能的超级计算机的支持,
因此
计算机技术在生物信息学的研究中显得尤为重要,本文就简
单介绍了计算机在生物信息学研究中的哪些方面起到了不 可忽略的作用
【关键词】生物信息学;计算机科学;基因组学
生物信息学是利用计算机为工具,用数学及信息科学的 理论和方法研究生命现象,对生物信息进行收集、加工、存 储、检索和分析的科学。生物信息学的核心是基因组信息学, 基因组学是研究生物基因组和如何利用基因的一门学问,该 学科提供基因组信息以及相关数据系统,试图解决生物、医 学和工业领域的重大问题。对于基因组学研究所产生的大量 数据必须借助于先进的计算机技术收集和分析处理这些生 物学信息,因此计算机科学为生物信息学的研究和应用提供 了非常好的支撑。
1.序列比对
序列比对其意义是从核酸、氨基酸的层次来比较两个或两个以上符号序列的相似性或不相似性,进而推测其结构功 能及进化上的联系。研究序列相似性的目的是通过相似的序 列得到相似的结构或功能,也可以通过序列的相似性判别序 列之间的同源性,推测序列之间的进化关系。序列比对是生 物信息学的基础,非常重要。
序列比对中最基础的是双序列比对,双序列比较又分为 全局序列比较和局部序列比较,这两种比较均可用动态程序 设计方法有效解决。在实际应用中,某些在生物学上有重要 意义的相似性不是仅仅分析单条序列,只能通过将多个序列 对比排列起来才能识别。比如当面对许多不同生物但蛋白质 功能相似时,我们可能想知道序列的哪些部分是相似的,哪 些部分是不同的,进而分析蛋白质的结构和功能。为获得这 些信息,我们需要对这些序列进行多序列比对。多重序列比
对算法有动态规划算法、星形比对算法、树形比对算法、遗
传算法、模拟退火算法、隐马尔可夫模型等,
传算法、
模拟退火算法、
隐马尔可夫模型等,
这些算法都可
以通过计算机得以解决。
2 ?数据库搜索 随着人类基因组计划的实施,实验数据急剧增加,数据
的标准化和检验成为信息处理的第一步工作,并在此基础上 建立数据库,存储和管理基因组信息。这就需要借助计算机 存储大量的生物学实验数据,通过对这些数据按一定功能分 类整理,形成了数以百计的生物信息数据库,并要求有高效 的程序对这些数据库进行查询,以此来满足生物学工作者的 需要。数据库包括一级数据库和二级数据库,一级数据库直 接来源于实验获得的原始数据,只经过简单的归类整理和注 释;二级数据库是对基本数据进行分析、提炼加工后提取的 有用信息。
分子生物学的三大核心数据库是GenBank核酸序列数据 库,SWISS-PROT蛋白质序列数据库和PDB生物大分子结构数 据库,这三大数据库为全世界分子生物学和医学研究人员了 解生物分子信息的组织和结构,破译基因组信息提供了必要 的支撑。但是用传统的手工分析方法来处理数据显然已经无 法跟上新时代的步伐,对于大量的实验结果必须利用计算机 进行自动分析,以此来寻找数据之间存在的密切关系,并且 用来解决实际中的问题。
3.基因组序列分析
基因组学研究的首要目标是获得人的整套遗传密码,要 得到人的全部遗传密码就要把人的基因组打碎,测完每个小 的序列后再把它们重新拼接起来。所以目前生物信息学的大 量工作是针对基因组DNA序列的,建立快速而又准确的DNA 序列分析方法对研究基因的结构和功能有非常重要的意义。 对于基因组序列,人们比较关心的是从序列中找到基因及其 表达调控信息,比如对于未知基因,我们就可以通过把它与 已知的基因序列进行比较,从而了解该基因相关的生理功能 或者提供疾病发病机理的信息,从而为研发新药或对疾病的 治疗提供一定的依据,使我们更全面地了解基因的结构,认 识基因的功能。因此,如何让计算机有效地管理和运行海量 的数据也是一个重要问题。
4?蛋白质结构预测
蛋白质是组成生物体的基本物质,几乎一切生命活动都 要通过蛋白质的结构与功能体现出来,因此分析处理蛋白质 数据也是相当重要的,蛋白质的生物功能由蛋白质的结构所 决定,因此根据蛋白质序列预测蛋白质结构是很重要的问 题,这就需要分析大量的数据,从中找出蛋白质序列和结构 之间存在的关系与规律。
蛋白质结构预测分为二级结构预测和空间结构预测,在 二级结构预测方面主要有以下几种不同的方法:①基于统计 信息;②基于物理化学性质;③基于序列模式;④基于多层 神经网络;⑤基于图论;⑥基于多元统计;⑦基于机器学习 的专家规则;⑧最邻近算法。目前大多数二级
您可能关注的文档
- 计算机网络主要威胁和防范措施.docx
- 计算机维护技术在企业中应用.docx
- 计算机维护教学方法探究.docx
- 计算机系统组建和办公自动化项目化教学实施方案.docx
- 计算机信息处理系统可靠性探究.docx
- 计算机信息管理系统在图书馆中应用研究.docx
- 计算机信息管理系统在血型参比实验室中的应用.docx
- 计算机信息管理专业实习报告.docx
- 计算机信息技术助力我国铁路事业高速发展.docx
- 计算机信息数据安全研究及加密技术探析.docx
- 六年级数学下册教学课件《解比例》.pptx
- 8.21.5 鸟类的生殖与发育(课件)八年级生物下册课件(苏教版).pptx
- 钠离子电池项目智能制造方案(范文参考).docx
- 2023-2024学年吉林省吉林市舒兰市七年级(上)期末语文试卷.docx
- 2024年吉林省吉林市丰满区亚桥实验学校中考数学三模试卷.docx
- 2023-2024学年吉林省辽源市东辽县七年级(上)期末英语试卷.docx
- 2023-2024学年吉林四平九年级数学第一学期期末水平检测试卷.docx
- 2023-2024学年吉林市蛟河市三校联考九年级(上)期末英语试卷.docx
- 2023-2024学年吉林松原九年级英语上册考场实战试卷.docx
- 电解液新材料项目智能制造方案.docx
最近下载
- 2024年华医网继续教育答案-冠心病中西医结合诊治新进展.docx VIP
- 益普索:汽车APP客户体验报告.pdf
- 临床生物化学检验技术.docx
- 医学装备工作流程.docx VIP
- [安庆项目资料库]安庆市中心城区排水【雨水)防涝综合规划(2013-2030)·文本.pdf
- F系列卧式沸腾干燥机使用说明.pdf
- 脑卒中患者用药教育参考幻灯片.ppt
- 小升初数学:单位换算大全专项练习100道(小考复习精编专项)(长度单位+重量单位+面积单位+时间单位+容积、体积单位)六年级数学小升初复习系列(含知识点+答案).docx
- 2024-2025学年高中历史选择性必修1教学课件 第四单元-第14课 当代中国的外交.pptx
- 幼儿园餐中保育案例及分析总结.docx VIP
文档评论(0)