shengwuxinxixue.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
shengwuxinxixue

shengwu xinxixue 生物信息学 (bioinformatics) 生物学和信息科学、数理科学结合所发展出来的交叉科学。狭义的生物信息学研究如何组织迅猛增长的海量生物学数据,并从数据中提取新知识。广义的生物信息学正在促成计算机和互联网时代的新生物学。生物信息学的概念和方法改变着生物和医学的许多分支学科的发展。生物信息学和计算生物学有密切关系,但又有所不同。一般说来,需要较多地依靠物理、化学和生物知识的计算,例如蛋白质和药物分子的相互作用,宜归入生物计算或计算生物学。主要从生物数据库出发,特别是从核酸和蛋白质序列的比较入手,发现或回答生物学问题,则属于生物信息学的范畴。 许多生物学家多年以来逐个研究基因、蛋白质、代谢途径、乃至细胞、个体、物种,积累了大量知识。以DNA的大规模测序为标志的基因组时代,开创了高通量、高产出、高度并行的研究方式。基因组学(genomics)研究一个物种的全部基因;转录组学(transcriptomics)研究全部转录产物;蛋白质组学(proteomics)研究全部蛋白质的相互作用。比较基因组学等则研究对比多个物种。各种各样的“组学”自成体系又互相关联,但都离不开海量数据的处理分析,因此生物信息学成为共同的支撑平台。 分子生物学及其中心法则。生物信息学源于海量生物数据的产生、管理和分析。这些数据乃是20世纪50年代以来生物学发展到分子水平的结果。请读者参阅分子生物学等有关条目。这里只略作介绍,以便引入必需的名词术语。 从细菌到人类,对生命活动的维持和延续起着关键作用的是两类生物大分子:核酸和蛋白质。核酸是核糖核酸的简称。这是由4种单体组成的线性的、不分叉的、有方向的高分子。每种单体是含有几十个碳、氢、氧、氮、磷等原子的有机分子,称为核苷酸。核苷酸由三部分组成:磷酸根、5碳糖和碱基。所有核苷酸的磷酸根和5碳糖都是相同的,它们因碱基不同而区分为腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶,通常用字母a、c、g和t代表。这里说的是5碳糖上两处羟基(OH)脱去了一个O的脱氧核糖核酸,简记为DNA。生物的遗传信息就编码在这4种字母沿DNA链的排列顺序中。事实上,DNA通常以双股螺旋的形式存在于细胞中。两股螺旋上对应的c和g,以及a和t以氢键相维系而组成螺旋。因此,两股DNA所含的信息是等价的,可以从一股读出另一股的字母。但它们在生物学上并不等价。例如,两股上编码的基因种类和数目不同,复制过程也不大相同。 原核生物的细胞没有细胞核。多数原核生物只有一条DNA。从酵母到人类都属于有细胞核的真核生物。每条微观的DNA分子要经过多级组织和折叠,才形成可以在显微镜下染色和观察的染色体。各个物种的染色体数目不同,人有23对,家鼠有19对,水稻有12对,酿酒酵母有16对。一个物种的不同的DNA或染色体的总合组成其基因组。基因组的大小相差悬殊,病毒或噬菌体只有几千到几万字母,细菌有几百万,酵母有1200万,果蝇有1.8亿,水稻有4.3亿,人有32亿。有些生物的基因组比人类大数十倍。 蛋白质是由20种单体组成的线性的、不分叉的、有方向的高分子。每种单体是一个氨基酸。单个氨基酸比核苷酸略小,包含一个氨基、一个羧基和一个残基。氨基酸的种类由残基确定,最简单的残基就是氢(甘氨酸)。自然界和实验室中遇到的氨基酸不只20种,然而生物蛋白质都由20种氨基酸构成,因而可用20种字母组成的符号序列表示。蛋白质在细胞内合成之后,有些还要经过“修饰”(磷酸化、糖基化等),被输送到相应的位置,折叠成特定的空间结构,才具有生物活性。常见的蛋白质序列长度从几十到几千个氨基酸。许多蛋白质要同其它蛋白质、DNA或RNA形成复合体来发挥生物功能。 还有一大类核酸的5碳糖没有脱氧,称为核糖核酸,简记为RNA。RNA通常以单股形式存在,它的单体中以尿嘧啶(用字母u代表)取代脱氧核糖核酸中的胸腺嘧啶t,因此也用4种字母组成的符号序列表示。RNA有很多种,它们对储存在DNA中的信息如何表达成蛋白质起着关键的中间作用。有些RNA直接起着贮存信息、催化生物化学反应或调控基因表达的作用。RNA的长度因种类不同而相差悬殊,从20个字母左右的小RNA到转录组中可能遇到的几十万字母,多种RNA还有待于发现或阐明功能。 DNA双螺旋的发现者之一克里克(F.H.C. Crick)早在1957年就根据当时还甚不完备的实验事实归纳出分子生物学的“中心法则”。按照现代理解,中心法则可以概括为:生物的遗传信息编码在DNA中,DNA可以复制;DNA中的信息根据所处条件有选择地、以不同速率转录到各种RNA中;编码蛋白质的基因信息转录到信使mRNA,经加工后的mRNA成为制造蛋白质的图纸,在核糖体中翻译出蛋白质序列;蛋白质是生物功能的主要体现者或表达者,它们必须折叠成特定形状才能

文档评论(0)

wujianz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档