网站大量收购独家精品文档,联系QQ:2885784924

机器学习大作业机器学习与生物信息学..docx

机器学习大作业机器学习与生物信息学..docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

机器学习大作业

机器学习与生物信息学

摘要

本文首先介绍了生物信息学的概念、产生的背景、主要的研究方法、研究方向以及机器学习的相关概念。然后通过比较两者所需解决的问题得到机器学习在解决生物信息学相关问题方面可以得到应用,并结合现实的应用,介绍了机器学习在生物信息学各方面的现实已有应用。最后对两者关系进行总结,得出两者在未来会相互促进、共同发展。

关键字:生物信息学机器学习

目录

第一章生物信息学的基本概念以及产生背景 1

1.1生物信息学的定义 1

1.2生物信息学的产生背景 1

第二章生物信息学的研究方法及一般步骤 3

2.1生物信息学的研究方法 3

2.2研究生物信息学的一般步骤 3

第三章当前生物信息学的主要研究方向 4

3.1序列比对 4

3.2蛋白质结构比对和预测 4

3.3基因识别非编码区分析研究 5

3.4分子进化和比较基因组学 5

3.5序列重叠群(Contigs)装配 6

3.6遗传密码的起源 6

3.7基于结构的药物设计 6

3.8生物系统的建模和仿真 6

3.9生物信息学技术方法的研究 7

3.10生物图像 7

3.11其他 7

第四章机器学习与生物信息学 8

4.1机器学习 8

4.2机器学习与生物信息学 8

第五章结论 11

1

第一章生物信息学的基本概念以及产生背景

1.1生物信息学的定义

生物信息学时生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科:以核酸、蛋白质等生物大分子数据库作为所要研究的对象,并利用数学、信息学、计算机科学等手段,以计算机硬件、软件和计算机网络为主要工具,对数量极其庞大的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。并通过对生物信息的查询、探索、比较、分析,从中获取基因编码、基因调控、核苷酸和蛋白质结构功能及其相互关系等理性知识。在大量的信息和知识的基础上,探索生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中的重大问题,搞清它们的基本规律和时空联系,建立“生物学周期表”。它通过对生物学实验数据的获取、加工、存储、检索和分析,从而达到揭示数据所蕴含的生物学意义的目的。

目前其主要的研究重点为基因组学(Genomics)和蛋白组学(Proteomics)两方面,具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构和功能的生物信息。目前基因组学的研究出现了几个重心转移:一个是将一直基因序列与功能联系在一起的功能基因组学的研究;一个是从作图为基础的基因分离转向以序列为基础的基因分离;三是从研究疾病的起因装箱探索发病机理;四是从疾病诊断转向疾病易感性研究。生物芯片的应用将为上述研究提供最基本和必要的信息和依据,将作为基因组学研究的主要技术支撑。生物信息学的发展为生命科学的进一步突破以及药物研制过程中革命性的改革提供了一个机会。就人类基因组来说,得到序列仅仅是第一步,后一步工作时所谓后基因组时代(post-genomeera)的任务,即收集、整理、检索和分析序列中表达的蛋白质的结构和功能信息,找出规律。

1.2生物信息学的产生背景

生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在,1871年Miescher从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色。

2

1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年JamesWatson和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。DNA以磷酸糖链形成发双股螺旋,脱氧核糖上的碱基按Chargaff规律构成双股磷酸糖链之间的碱基对。这个模型表明DNA具有自身互补的结构,根据碱基对原则,DNA中贮存的遗传信息可以精确地进行复制。他们的理论奠定了分子生物学的基础。DNA双螺旋模型已经预示出了DNA复制的规则,Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA聚合酶I(DNApolymeraseI),能使4种dNTP连接成DNA。DNA的复制需要一个DNA作为模板。Meselson与Stahl(1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗

您可能关注的文档

文档评论(0)

阿弥陀佛 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档