- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(生物信息学课件)第9讲生物信息学的计算机、统计学及数学基础
生物信息学的计算机、统计学及数学基础 主讲: 王元茂 生物信息学的定义: 生物信息学是指应用信息科学的理论、方法和技术,管理、分析和利用生物数据。 通过收集、组织、管理生物数据,使研究人员能够迅速地获得和方便地使用相关信息; 通过处理、分析、挖掘生物分子数据,得到深层次的生物学知识,加深对生物世界的认识; 在生物学、医学的研究和应用中,利用生物分子数据及其分析结果,可以大大提高研究和开发的科学性及效率. 如:根据基因功能分析结果来检测与疾病相关的基因,根据蛋白质分析结果进行新药设计。 生物信息学的定义: 生物信息学是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。因此,计算机技术将是进行生物信息学研究的重要手段;而数学知识是研究的重要方法。 目前,一般提到的 生物信息学 是就指这个狭义的概念,更准确地说,应该是分子生物信息学(Molecular Bioinformatics)。 一、所用的方法和技术汇总 1、数学统计方法 2、动态规划方法 3、机器学习与模式识别技术 4、数据库技术及数据挖掘 5、人工神经网络技术 6、专家系统 7、分子模型化技术 8、量子力学和分子力学计算 9、生物分子的计算机模拟 10、因特网(Internet)技术 1、数学统计方法 生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。因此概率论和数学统计是现代生物学研究中一种常用的分析方法 数据统计、因素分析、多元回归分析是生物学研究必备的工具 隐马尔科夫模型(Hidden Markov Models)在序列分析方面有着重要的应用。与隐马尔科夫模型相关的技术是马尔科夫链(Markov Chain) 2、动态规划方法 动态规划(Dynamic Programming)是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法 动态规划解决问题的基本过程是:将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部”逐渐接近“全局”,最终获得全局最优解 4、数据库技术及数据挖掘 数据库技术 数据仓库 虚拟数据库技术(Virtual Database,简称 VDB) 数据挖掘(data mining) 又称作数据库中的知识发现 (Knowledge Discovery in Database),它是从数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进行归纳性推理和联想,寻找数据间内在的某些关联,从中发掘出潜在的、对信息预测和决策行为起着十分重要作用的模式 数据挖掘过程一般分为4个基本步骤:数据选择、数据转换、数据挖掘和结果分析 5、人工神经网络技术 人工神经网络(Artificial Neural Network, 简称ANN)是通过模拟神经元的特性,以及脑的大规模并行结构信息的分布式和并行处理等机制建立的一种数学模型 在生物信息学中,使用得最多的是反向传播神经网络(Back Propagation Neural Network,简称BP网)。BP网被认为是稳定性和鲁棒性较强的人工神经网络之一,而且属于有监督学习的网络模型。 标准的BP网由三层神经元组成:输入层、隐藏层和输出层 6、专家系统 专家系统(Expert System)是一种基于知识的智能系统,它将领域专家的经验用一定的知识表示方法表示出来,并放入知识库中,供推理机使用 知识库是专家系统的第一重要组成部分,知识库中的知识通常分为两类: 一类领域的事实性知识或广泛公用的知识 另一类是启发性知识,是该领域专家在长期研究和实践过程中积累起来的经验总结 知识获取方式大致上可以分为两种: 一种是由知识工程师向领域专家询问有关知识,经过整理编辑后将知识转换成计算机表示形式,送入知识库 另一种是针对大量数据进行机器学习,分析、总结和抽取出有用的新知识,这是更高层次的知识获取方式。 专家系统的另一个重要部分是推理机,由它来控制和协调整个系统,并根椐当前输入的数据和知识,按一定的推理策略,去解决当前的问题,推导出结论 * * 1.计算机技术2.统计学基础3.模式识别方法4.分子模拟 3、机器学习与模式识别技术 机器学习 机器学习是模拟人类的学习过程,以计算机为工具获取知识、积累经验 1、遗传算法采用随机搜索方法,具有自适应能力和便于并行计算 2、神经网络的理论是基于人脑的结构,其目的是揭示一个系统是如何向环境学习的,这一种方法被称为联接主义。 模式识别 模式识别是机器学习的一个主要任务。模式是对感兴趣客体定量的或者结构的描述,而模式识别就是利用计算机对客体进行鉴别,将相同或者相似的客体归入同种类别中 模式识别主要有两种方法: 根据对象的统计特征
文档评论(0)