网站大量收购闲置独家精品文档,联系QQ:2885784924

3 生物分子的计算机模拟 - 吉林大学课程中心.ppt

3 生物分子的计算机模拟 - 吉林大学课程中心.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3 生物分子的计算机模拟 - 吉林大学课程中心

* 计算机在生命科学中的应用现状 1. 数据库技术:数据的储存与挖掘 计算机技术在生物学的应用中,数据库(database)技术是最基本的技术。生物实验数据的储存、管理、查询都是建立在数据库管理系统之上的。 生物数据的特点:结构和组织方式复杂、数据量增长十分迅速。 《核酸研究》自2000年起每年的第一期都发表最新的生物数据库论文。目前正式发表生物数据库已接近2000个。 传统的关系数据库难以有效储存复杂的生物数据,因此必须采用面对对象的数据库技术,如基于XML的数据库。 针对分散在全球个地的海量的并且相互关联的生物数据,数据仓库(data warehouse)技术可以互相独立的数据源中提取面向主题的数据集合,并将这些数据按一定的逻辑顺序重新进行组织与集成,从而为用户提供决策支持分析。 数据挖掘(data mining)技术是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、事先不知道的、但又有意义的信息和规律(啤酒与尿不湿的故事)。 计算机在生命科学中的应用现状 1. 数据库技术:数据的储存与挖掘 (插入页1) 传统的关系数据库难以有效储存复杂的生物数据,因此必须采用面对对象的数据库技术,如基于XML的数据库。 传统关系型数据库: 面对对象型数据库: 病人资料 癌症 55 男 2 关节炎 42 女 1 疾病 年龄 性别 病人编号 病人资料 病人 编号1/编号 性别女/性别 年龄42/年龄 疾病关节炎/疾病 /病人 病人 编号2/编号 性别男/性别 年龄55/年龄 疾病癌症/疾病 /病人 /病人资料 计算机在生命科学中的应用现状 1. 数据库技术:数据的储存与挖掘 (插入页2) 传统的关系数据库难以有效储存复杂的生物数据,因此必须采用面对对象的数据库技术,如基于XML的数据库。 传统关系型数据库: 面对对象型数据库: 病人资料 病人资料 病人 编号1/编号 性别女/性别 年龄42/年龄 疾病关节炎 等级二级/等级 /疾病 /病人 病人 编号2/编号 性别男/性别 年龄55/年龄 疾病癌症 类型肝癌/类型 /疾病 /病人 /病人资料 关节炎:一级、二级、三级。。。 癌症:胃癌、肝癌、乳腺癌。。。 癌症 55 男 2 关节炎 42 女 1 疾病 年龄 性别 病人编号 计算机在生命科学中的应用现状 2. 机器学习与模式识别技术 机器学习实质是一种统计学的方法,它自动从一个样本集合的训练过程中获得信息规律,用这个规律去判断其他数据集合。 常用算法:神经网络法、投票法、决策树法、支持向量机法等。 模式识别是机器学习的一个主要任务。模式识别的关键是通过数据分析,提取数据对象的本质特征,建立特征模型。之后判断新的数据对象是否符合这个特征模型。比如:RNA序列翻译蛋白质的密码表。 机器学习是比较年轻的人工智能。 3. 生物分子的计算机模拟 生物分子的主要实验研究方法:DNA测序、X射线或核磁共振法测定生物分子的三维结构、生化突变实验确定生物分子之间相互作用位点、药物分子和靶分子的结合等。 计算机模拟:从原子水平上的相互作用出发,为待模拟的分子体系建立的物理模型,描述分子内和分子间的相互作用。然后基于分子动力学原理,进行体系的能量极小化。 计算机在生命科学中的应用现状 4. 网络技术 Internet上有着巨大的生物学资源,但如何集成这些资源,使得资源之间可以相互交流,用户可以查询操作?需要一个“Web服务”来实现网络终端机器之间的通讯和操作。目前W3C定义的Web服务工作平台是XML + HTML。HTTP 协议是最常用的因特网协议。XML是一种可用于不同的平台和编程语言之间的语言。 5. 高性能计算 生命科学研究中要对大量的样本进行分析计算,这为高性能计算提供了一个很大的应用领域。比如,模拟一个普通蛋白质分子在水环境中的动态过程,1纳秒(10-9秒)约需要100个核的计算机并行运算2小时。 TOP500组织超级计算机排名

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档