- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第32卷第4期2003年8月Vol.32,No.4Aug.,2003信息与控制
第32卷第4期
2003年8月
Vol.32,No.4Aug.,2003
文章编号:1002-0411(2003)04-0352-06
机器学习与生物信息学
(西南科技大学生命科学与工程学院,四川绵阳621000)
摘要:后基因时代,探索和解释隐藏在分子生物学数据库中的有用信息将是对生物信息学研究人员的巨大挑战!为了解决分子生物学中遇到的这些难题,有效及廉价的方法是非常必要的.机器学习是一种自动的、具有智能学习技术的方法,有助于达到上述目的。本文就知识发现、人工神经网络、决策树、贝叶斯网络、遗传算法、隐马尔科夫链、聚类、归纳逻辑编程、支持向量机等机器学习方法在生物信息学中的应用进行了系统地评述.这些方法有助于加速生物分子结构预测、基因发现、基因组学和蛋白组学等方面的研究进展.
关键词:机器学习;生物信息学;学习方法;人工智能
中图分类号:TP181文献标识码:A
MACHINELEARNINGANDBIOINFORMATICS
ZHOUHai-ting
(SouhwestUnioersityofScienceTechnology,Mianyang621000,China)
Abstract::Exploringandexplainingtheknowledgehiddeninthebiomoleculardatabasehasbecomethegrandchallengeforbioinformaticsinthepostgenomeera.Anefficientandinexpensiveapproachisrequiredtosolveprob-lemsinmolecularbiology;machineleamingwhichisanautomaticandintelligentlearingtechniquemayhelptoa-chievethisrole.KDD,ANNs,DecisionTrees,BBNs,GAs,HMMs,Clustering,ILP,SVMareintroducedinthecontextoftheirapplicationinbioinformatics,toexperimentalbiologistsandbioinformaticiansinthispaper.Theseap-proacheshelptoaccelerateseveralmajorresearches(biomolecularstructureprediction,genefinding,genomicsandproteomics).
Keywords:machinelearning;bioinformatics;learningmethods;intelligent
随着人类基因组草图的完成,生物学资料象洪流一样滚滚而来,PDB(蛋白质资料数据库)和Gen-Bank等数据库均以几何级数的速度扩容,Benson等人1等人经过分析认为,目前生物学数据库中存贮的数据每13~15个月增加一倍,其增长速度比著名的摩尔定律还要快3个月.处理和分析累积在这些数据库中的资料将是对生物信息学研究人员的巨大挑战!本文对生物信息学进行了简单描述,着重介绍了目前流行的机器学习方法在生物信息学研究中的应用.
1生物信息学(Bioinformatics)
生物信息学是一个融合了多个学科的领域,包含了分子生物学(如生物化学、遗传学、结构生物学等)、计算机科学(计算理论、人工智能、机器学习、动态程序设计等)、物理化学(热力学、分子建模等)
和数学(算法、建模、概率论、统计学等).由于涉及的领域宽,加之发展异常迅速,很难对生物信息学的研究范围作出明确的界定.目前涉及到的研究领域有:基因组学、蛋白质组学、生物化学路径分析、数据挖掘、分子进化、分子建模及算法化等.
生物信息学(bioniformatics)是由“bio-”和“in-formatics两部份构成.“bio-”代表分子生物学,而informatics则意味着计算机科学.因此,这两个单词结合在一起,表示了用计算机科学解决分子生物学研究中遇到的问题的含义.
在基因组过渡时代,数据库的概念也从文本库演化到事实库最
您可能关注的文档
- 中考英语复习方案 语法互动十 时态和语态权威课件(名师点睛 考点过关 以真题为例).pptx
- 客服PPT电话礼仪培训.pptx
- 剑侠世界手游武林秘籍之全职业分析(1).docx
- 学生社团指导教师登记表.docx
- 2019秋新人教版部编本六年级语文上册教材分析与解读.pptx
- 推动党的创新理论入脑入心见行见效.pptx
- 讲规矩有纪律 党课.docx
- 社区扫黑除恶工作总结&法院扫黑除恶专项斗争工作总结.docx
- 精编各单位推进“扫黑除恶”专项斗争工作总结6篇.pptx
- 扫黑除恶PPT模板 重拳出击深入开展扫黑除恶专项斗争主题宣传教育PPT模板 《关于开展扫黑除恶专项斗争的通知》学习解读PPT模板.pptx
- 2025年陕西省榆林市榆阳区中考一模数学试题(含简单答案).pdf
- 广东省恩平市事业单位考试(中小学教师类D类)职业能力倾向测验重点难点精练试题及答案一套.docx
- 广东省普宁市事业单位考试(中小学教师类D类)职业能力倾向测验重点难点精练试题汇编.docx
- 广东省普宁市事业单位考试职业能力倾向测验(中小学教师类D类)强化训练题库及参考答案1套.docx
- 广东省恩平市事业单位考试(中小学教师类D类)职业能力倾向测验重点难点精练试题推荐.docx
- 2025年上海市宝山区通河中学高考数学第一次调研试卷(3月份)(含答案).pdf
- 广东省恩平市事业单位考试(中小学教师类D类)职业能力倾向测验知识点试题附答案.docx
- 广东省恩平市事业单位考试(中小学教师类D类)职业能力倾向测验试卷一套.docx
- 广东省恩平市事业单位考试(中小学教师类D类)职业能力倾向测验知识点试题最新.docx
- 2025年理光(深圳)工业发展有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案.docx
文档评论(0)