基因表达数据的模糊聚类技术研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
II 104I EducationForum教育论坛 基因表达数据的模糊聚类技术研究 李小梅 郭 红 (福州大学数学与计算机科学学院 福建福州 350108) 摘要:利用聚类分析工具可以从海量的、日益增长的基因表达数据中解析出其中可能的编码基因及其生理 功能,这是生物信息学中一项很有意义的工作。模糊聚类算法是一种常用的基因表达数据聚类分析工具,j-~,;z 发现重叠的基因簇,它不强制将每个基因归入某个具体的聚类中,而是计算每个基因对各个类的隶属度。本文 分析了基因表达数据的模糊聚类分析方法及其重要应用。 关键词:生物信息学;基因表达数据;模糊聚类 一 、 引言 缸Ⅲ∈ 和c个聚类中心 c尺,使目标函数达到最 小,其中P是向量维数。FCM算法的目标函数定义为 随着 cDNA微阵列和寡核苷酸芯片高通量检测技 f n 术的发展和应用,大量基因表达数据的获取变得越来 ’’ 1n m , = Mdi ,ml 式 J 越容易。基因表达数据是通过实验直接或间接测量得 k = ,i= 』 到的基因转录产物信使 RNA(mRNA)在细胞 中的丰度 其 中, M=,M∈ ,。Bezdek等已经证 明了 k= 』 。 面对 日益增长、复杂的基因表达数据 ,如何有效地挖 掘其中隐含的生物信息已成为后基因组时代研究热点 FCM算法不能保证收敛到 目标函数的极小值点。另外, 之一。聚类分析本着 “物以类聚”的思想,旨在将功能相 FCM对模糊参数m的选择、初始中心(或初始隶属度) 关的基因归入同一基因簇中,已成为分析基因表达数 的选择、数据的输入顺序等都 比较敏感,而且 FCM从 据获取生物信息的有效工具。本文系统评述了基因表 本质上来说是一种局部搜索算法。 达数据模糊聚类中所用到的各种技术方法。由于聚类 大量研究表 明,模糊聚类算法很好地挖掘了基因 问题的开放性,评价一个聚类算法的优劣不仅仅要从 间的关系。文献 用/FCM算法对时序基因表达数据进 数学的角度出发,而且要在生物学意义下进行评价,因 行聚类分析 ,通过对不同噪音水平的基因表达数据的 此本文并不用统一的评价标准对所有的聚类算法进行 测试,实验结果验证了FCM算法比传统的K—Means聚 评价。 类算法鲁棒性好 。由于FCM算法存在这些缺陷,下面 传统的基因表达数据聚类分析主要有基于划分的 分别介绍将模糊聚类算法应用到基因表达数据聚类分 方法 、基于层次的方法崂 口基于人工神经网络的方法4[1 析上所做的改进 。 等。从生物学角度看,传统的聚类方式生成的是基因表 (一)自动生成最优聚类数 目 达数据的一个划分,基因簇之间没有重叠,然而一个基 Gasch等 6//提出一种 FCM 的启发式改进算法 因通常具有多面性,在不同的条件下可能与不同的基 FuzzyK,该算法对基因表达数据执行三次 FCM处理。 因组其调控,因此各个聚类之间应该有重叠的现象。为 第一次FCM迭代结束后,若一个基因与其 中的某聚类 了获得重叠的基 因簇 ,模糊聚类就很 自然地应用到基

文档评论(0)

jsntrgzxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档