数据挖掘技术在生物信息学中的应用论文.pdfVIP

数据挖掘技术在生物信息学中的应用论文.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
参考文献 [1]扬1lf 2 33 36 VN盯的有线自视收赞及客户管理幕托∞设计与实现[J]自*与信息技术.2004 Basic [z]簧智趣·}蚌蚌着Ⅵsll且l NETⅢ目*发实践[M].北京中国接道mⅨ#.2003lo 222—282 [站黄鹏,鬻值曹弱超Vb∞llhsic 3 NLT信息系统设计与*发实例[M]n京机械I业&版社.2005153 作者简介 m博±在4.#m*i学&*耳‰#学自撞$荦EM%t、■##.i}*£}自自算机■#*|白. 柱雪陈耒知 (沈阳化工学院计算矾科学与技术学院110142) [摘要]生物信息学是一门新*的交叉学科。人党基目组计划的启动和实旄使得按醺、蛋自质数据迅 速增长·如何从海量数据中获取有效信息成为生特信息举迫切耍解央的问题.研究证明教据挖掘技术是生 曲信患处理的强有力I具。数据挖掘在生轴信患学中的应用将取得夏大的进晨。 [美羹词]生暂信息学数据挖掘 数据库 1.引言 随着人粪基因组计划的实臆·通过基因组序列、蛋白质序刊的测序,蛋白质结构与功能的预溅等实 验,分子生物学家提供了大量的有关生物分子的原始散据,进些数据需要综台利用数学、物理、信息科学 与技术荨进行处理和分析t因而生物信息学应运而生。它是分子生物学与上述学科交叉结合的产物。大量 的生物信息数据还在继续快速增长,国内外各种生物信息数据处理新方法的研究工作正在擞烈的展开。其 中数据挖掘技术在生物信息数据处理中的应用研究具有广阔的空间。 2.相关概念 2.1生物信息学的概念 生物信息学是以棱酸、蛋白质等生物太分子敷据库为主要对象,以散学、信息学、计算机科学为主要 手段t以计算机硬件、软件和计算机网络为主要工具t对浩如烟拇的原始数据进行存储、管理、注释、加 工·使之成为具有明确生物意义的生物信息。并通过肘生钎信息的查询、搜索、比较、分析,从中获取基 因编码、基因调控、校酸和蛋白质结构功能及其相互关系簪理性知识.在大量信息和知识的基础上.探索 生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中的重太问题.搞清它 们的基本规律和时空联系,建立“生物举周期表”. 很显然t生物信息学的研究对象是生物数据.当然最“经典”的是分子生物学散据.使基因纽技术的 产物:DNA序列,后基因组时代将从系统角度研究生命过程的各个层次,走向探索生命过程的每个环节 微观(深^到研究单十分子的结构和运动规律)和宏观(节和宏观生态学,从大的角度来研究生命过程)。 着重于“序列.结拇、功能,应用”中的“功能和应用”部分.就研究面来说.涉及并参与各生命科学领 域的研究。 ,28 2.2数据挖掘概念 in 数据挖掘也称为数据库知识发现(KnowledgeDiscov2ery 出有效的、新颖的、潜在有用的、并且最终可理解的模式的非平凡过程[1]。它被广泛的应用到各个领域, 挖掘数据之间潜在的模式,找出有价值的信息。KDD的基本过程如图1所示,由以下部分组成: (1)数据预处理(包括数据清理、数据集成、数据变换、数据归纳,为数据挖掘做准备 (2)数据挖掘(核心步骤,使用智能方法提取数据模式) (3)模式评估(根据某种度量,识别表示知识的真正模式) (4)知识表示(使用可视化知识表示技术,向用户提供挖掘的结果——知识) 图I KDD的基卒过程 可以看出,数据挖掘是KDD的核心部分,是采用机器学习、运筹学、统计方法等进行知识发现的阶 段。但是从广义上讲,数据挖掘的定义就是从海量数据中提取知识的过程,也就等同于KDD,这个定义 在各界普遍流行。本文也采用“数据挖掘”的广义观点。 数据挖掘是在已有的大量数据中寻找模式的决策支持过程,它从理论和技术上继承了知识发现领域的 成果,同时又借鉴了许多其他领域的理论和

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档