- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文章编号:1007—1423(2012)35—0018—04 DOI:10.3969~.issn.1007-1423.2012.35.005
基于模糊聚类分析方法的基因序列分类研究
李 勤
(四川大学计算机学院,成都 610065)
摘 要 :模糊聚类分析方法具有分类简单且分类结果精度较高的优点。针对基因序列分类这一具体
问题 .提 出一种 DNA序列判别特征的提取方法。这种方法考虑基 因序列(DNA序列)的排
序性 .并根据模糊 聚类分析方法得到模糊相似矩阵和其传递 闭包 ,从而实现 DNA序列 的
分类 仿真结果表 明.这种方法能够挖掘 DNA序列 中的更多信息,提高分类的准确性和客
观性 ,得到很好 的结果 。
关键词 :模糊聚类分析 :模糊矩阵;传递 闭包;DNA序列
1 问题的提出 这 40个序列也放在如下地址的网页上.用数据文
件Art—model—data标识 .供下载:
当今.信息技术和生命科学快速发展 作为一门新
网易网址:www.163.c0m 教育频道在线试题
兴的前沿学科,生物信息学fBi0inf0matiCS1将生命科学、
教育网:www.cbi.pku.edu.cnNeWSmcm2000
计算机科学 、信息科学和数学等学科交汇融合 .形成的
教育网:www.csiam.edII.C:n/mcm
一 门交叉性学科 11『它主要利用生物学、计算机 、数学 、
物理等知识对大量的生物学数据进行处理 .从而实现 2 问题分析
对生物信息的获取、处理、存储、分类等 ,来阐明和挖掘
根据生物工程理论 ,DNA序列 由A、T、C、G四种碱
大量数据所包含的生物学意义 DNA序列作为一类重
基组成 ,它们在 DNA链上排列的顺序称为碱基序列
要的生物数据 ,对其数据的研究 、解读 、挖掘是后基因
模糊聚类分析是 以模糊数学对模糊集的理论l3~51为基
组时代的主要研究任务 2000年 6月.人类基因组计划
础 .处理未知类别数量 、多元聚类标准的聚类 问题 根
完成了DNA全序列的草图 从此.人类拥有一本记录
据上述提出的问题 .可采用模糊聚类方法研究 DNA序
自身生老病死及遗传进化的全部信息的 “天书”
列分类问题。模糊聚类分析方法的步骤是 :首先 ,把
作为研究基因序列结构的尝试.提出以下对序列
DNA序列用一个 向量数据表示.即进行DNA序列特征
集合进行分类的问题I2]:
(聚类要素)提取。然后 .按照模糊聚类的方法对提取的
下面有 20个 已知类别的人工制造的序列 .其中序
要素进行聚类分析 模糊聚类的方法有很多种.聚类编
列标号 1~1O为A类 .11
文档评论(0)