- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CIS_一种基于迭代扩张的微阵列数据聚类算法_王晓明
2007V ol.34 №.8
CIS:
1 2
1 2
(辽宁科技大学电信学院 鞍山 114044) (东北大学 沈阳110004 )
DN A 微阵列技术使同时监测成千上万的基因表达水平成为可能。 直接把传统聚类 法用于高维基因表达
数据分析会受到“维难”的困扰。特征转换和特征选择是两种常用的降维方式, 但前者产生的新特征难以用原来的领
域知识解释, 后者通常会丢失信息。 另外, 传统的聚类 法通常由用户指定聚类参数, 参数设置不同对聚类结果有很
大的影响。 针对上述问题, 本文提出了一种新的基于迭代扩张的微阵列数据聚类 法-CIS。 它不采用特征转换和特
征选择的方式, 并自动确定聚类参数。 CIS 反复用最新得到的样本聚簇得到新的聚类基因, 然后以新的基因聚簇为特
征重新聚类样本, 逐步求精, 最终的结果容易解释且避免了信息的丢失。 该方法降低了由于用户缺少领域知识引起的
实验误差。 CIS 法被应用于两 个真实的微阵列数据集, 实验结果证实了 法的有效性。
微阵列, 聚类, 降维
CIS:An I terative Spread-based Algorithm for Clustering Micro-array Data
WA NG Xia-o M ing1 YIN Ying 2
1 2
(Liaoning U niversi y of Science and T ech nology , A nshan 114044) (N or heas ern U niversi y, Sheny ang 110004)
Abstract DN A M icr -o ar ray echnique makes i possible o simul aneo u sly mo ni or he e xpression levels o f ens o f
hou sands of g enes . T he r adi ional clu s ering me hods w ill suff er fro m he curse of dimensio nali y w hen direc ly ap-
plied o M icr -o ar ray da a. T he w o commo n dimensionali y reduc ion me ho ds, i . e. f ea ure ransforma ion and f ea ure
selec ion, are unsui able fo r he analy sis of M icr -o ar ray da a, since he for me r g ene ra es he new f ea ures diff icul o in-
e rpre and he la er misses some infor ma ion . Be sides, mos radi ional clu s e ring algo ri hm s need he u se-r specif ic
pa rame ers, w hich may resul in qui e diff e ren resul s. In his paper, w e presen an i er a ive spread-based algo ri hm,
namely CIS, fo r clu s ering M icro-ar ray da a, w hich selec s
文档评论(0)