小 型 微 型 计 算 机 系 统 2010年 8月 第 8期 Jou rnal of Ch inese Compu ter System s Vo l3 1 No. 8 20 10 Cham eleon 算法的改进 蒋盛益 , 庞观松 , 张黎莎 (广东外语外贸大学 信息学院, 广东 广州 510420) E m a il: j iangshengy i@ 163. com 摘  要 : 结合 C ham e leon 算法可以发现高质量的任意形状 、大小和密度的自然簇及一趟聚类算法快速高效的特点, 研究可以处 理混合属性的高效聚类算法. 首先简单改进 C ham e leon 算法 ,使之可以处理含分类属性的数据; 进而提出一种两阶段聚类算法. 第一阶段使用一趟聚类算法对数据集进行初始划分 ,第二阶段利用改进的 C ham e leon 算法归并初始划分而得到最终聚类. 在真 实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的. 关 键 词 : 一趟聚类算法; 基于图的聚类算法; 任意形状簇 中图分类号 : TP309     文献标识码 : A       文 章 编 号 :( 2010) Enhan ced C ham eleon C lu ster in g A lgor ithm J IAN G Shengy i , PAN G G uan song , ZHAN G L isha ( Schoo l of Inform a tics, Guangdong U n iversity of F ore ign Stud ies, G uangzhou 510420, Ch ina ) A b stract: In v iew of the fac t that C ham e leon c lu stering a lgo rithm can iden tify the da ta w ith arb itrary shap e, s ize and den s ity, and one p ass c lustering a lgorithm has the eff ic ien t fea tu re, an eff ic ien t c lu stering a lgorithm is p resen ted, the c lu stering a lgo rithm can p rocess the data w ith catego rica l a ttribu tes. F irst, C ham e leon is im p roved to p rocess the data w ith catego rica l a ttribu tes. S econd, by com b i n ing onep ass c lu stering a lgo rithm w ith im p roved C ham e leon c lu stering a lgo rithm , a tw ostage enhanced C ham e leon c lu stering a lgo rithm is p resen ted. In the f irst stage, onep ass c lustering a lgorithm is u sed for group ing the da ta (w e ca ll it orig ina l p artition) . In the second stage, w e m erge tha t p artition w ith im p roved C ham e leon c lu stering a lgo rithm so tha t the f ina l c lusters are ob ta ined. The exp er im en ta l resu lts on rea l da tase ts and syn the tic da tase ts show that


