- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
参考文献
[1]扬1lf 2 33 36
VN盯的有线自视收赞及客户管理幕托∞设计与实现[J]自*与信息技术.2004
Basic
[z]簧智趣·}蚌蚌着Ⅵsll且l
NETⅢ目*发实践[M].北京中国接道mⅨ#.2003lo 222—282
[站黄鹏,鬻值曹弱超Vb∞llhsic 3
NLT信息系统设计与*发实例[M]n京机械I业&版社.2005153
作者简介
m博±在4.#m*i学&*耳‰#学自撞$荦EM%t、■##.i}*£}自自算机■#*|白.
柱雪陈耒知
(沈阳化工学院计算矾科学与技术学院110142)
[摘要]生物信息学是一门新*的交叉学科。人党基目组计划的启动和实旄使得按醺、蛋自质数据迅
速增长·如何从海量数据中获取有效信息成为生特信息举迫切耍解央的问题.研究证明教据挖掘技术是生
曲信患处理的强有力I具。数据挖掘在生轴信患学中的应用将取得夏大的进晨。
[美羹词]生暂信息学数据挖掘 数据库
1.引言
随着人粪基因组计划的实臆·通过基因组序列、蛋白质序刊的测序,蛋白质结构与功能的预溅等实
验,分子生物学家提供了大量的有关生物分子的原始散据,进些数据需要综台利用数学、物理、信息科学
与技术荨进行处理和分析t因而生物信息学应运而生。它是分子生物学与上述学科交叉结合的产物。大量
的生物信息数据还在继续快速增长,国内外各种生物信息数据处理新方法的研究工作正在擞烈的展开。其
中数据挖掘技术在生物信息数据处理中的应用研究具有广阔的空间。
2.相关概念
2.1生物信息学的概念
生物信息学是以棱酸、蛋白质等生物太分子敷据库为主要对象,以散学、信息学、计算机科学为主要
手段t以计算机硬件、软件和计算机网络为主要工具t对浩如烟拇的原始数据进行存储、管理、注释、加
工·使之成为具有明确生物意义的生物信息。并通过肘生钎信息的查询、搜索、比较、分析,从中获取基
因编码、基因调控、校酸和蛋白质结构功能及其相互关系簪理性知识.在大量信息和知识的基础上.探索
生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中的重太问题.搞清它
们的基本规律和时空联系,建立“生物举周期表”.
很显然t生物信息学的研究对象是生物数据.当然最“经典”的是分子生物学散据.使基因纽技术的
产物:DNA序列,后基因组时代将从系统角度研究生命过程的各个层次,走向探索生命过程的每个环节
微观(深^到研究单十分子的结构和运动规律)和宏观(节和宏观生态学,从大的角度来研究生命过程)。
着重于“序列.结拇、功能,应用”中的“功能和应用”部分.就研究面来说.涉及并参与各生命科学领
域的研究。
,28
2.2数据挖掘概念
in
数据挖掘也称为数据库知识发现(KnowledgeDiscov2ery
出有效的、新颖的、潜在有用的、并且最终可理解的模式的非平凡过程[1]。它被广泛的应用到各个领域,
挖掘数据之间潜在的模式,找出有价值的信息。KDD的基本过程如图1所示,由以下部分组成:
(1)数据预处理(包括数据清理、数据集成、数据变换、数据归纳,为数据挖掘做准备
(2)数据挖掘(核心步骤,使用智能方法提取数据模式)
(3)模式评估(根据某种度量,识别表示知识的真正模式)
(4)知识表示(使用可视化知识表示技术,向用户提供挖掘的结果——知识)
图I KDD的基卒过程
可以看出,数据挖掘是KDD的核心部分,是采用机器学习、运筹学、统计方法等进行知识发现的阶
段。但是从广义上讲,数据挖掘的定义就是从海量数据中提取知识的过程,也就等同于KDD,这个定义
在各界普遍流行。本文也采用“数据挖掘”的广义观点。
数据挖掘是在已有的大量数据中寻找模式的决策支持过程,它从理论和技术上继承了知识发现领域的
成果,同时又借鉴了许多其他领域的理论和
您可能关注的文档
最近下载
- ISO27001 2022版内审全套资料(内审计划+检查表+审核报告等).doc
- fidic99版新红皮书中英文双语对照版.docx VIP
- 钢板弹簧设计计算程序Ver1.0-20070405.xls VIP
- 区块链产业学院建设思路与规划.pptx VIP
- 建筑外门窗气密、水密、抗风压性能分级(1).doc VIP
- 读本低年级 第2讲《一心跟着共产党》第二课时《党和人民心连心》教学课件.pptx VIP
- 数控车床高级工理论考试题库(含答案).docx VIP
- 《WPS Office办公应用案例教程》教学课件 项目8 WPS Office App文档的基本应用.ppt VIP
- 《WPS Office办公应用案例教程》教学课件 项目9 WPS Office App表格和演示文稿的应用.ppt VIP
- 通用质量特性工作计划-模板.docx VIP
文档评论(0)