- 5
- 0
- 约8.27千字
- 约 14页
- 2017-02-12 发布于江苏
- 举报
相似性度量在基因表达聚类分析中的应用研究
摘要:聚类分析是基因表达数据分析研究的主要技术之一,其算法的基本出发点在于根据对象间相似度将对象划分为不同的类,选择适当的相似性度量准则是获得有效聚类结果的关键。采用预处理过的基因数据集在不同相似性度量准则下进行的不同聚类算法的聚类分析,并得到聚类结果评价。其中算法本身的缺陷及距离相似性度量的局限性都是影响结果评价的因素,为了获得更有效的聚类结果,改进相关聚类算法并提出了一种比例相似性度量准则。
关键词:dna微阵列; 聚类分析; 相似性度量; 基因表达
dna 微阵列(dna microarray) 技术的日益成熟导致了基因表达数据不断扩大,尤其在近十几年内更以指数形式增长。如何分析和处理大量的基因表达数据,从中提取有用的生物学或医学信息,已成为后基因组时代研究的瓶颈[12]。由于基因芯片产生巨量的表达谱数据,数据挖掘技术已经被广泛的应用到基因表达谱的许多方面,并取得成功。聚类分析是基因表达数据分析研究的主要技术之一[23],并且作为一种有效的数据分析工具, 已广泛地应用于图像处理、信息检索、数据挖掘等领域。
目前,作为研究基因表达数据的主要技术之一的聚类分析算法有很多种,如分层聚类(hierarchical clustering),k均值聚类(k_means clustering),自组织映射(self organizing
原创力文档

文档评论(0)