取e大数据翻译.docVIP

  • 3
  • 0
  • 约1.73万字
  • 约 19页
  • 2017-01-03 发布于湖南
  • 举报
重排聚类: 陷阱、补救措施和应用程序 Sharlee Climer 计算机科学与工程系 圣路易斯华盛顿大学 63130 - 4899年圣路易斯,密苏里州,美国 Weixiong Zhang 计算机科学与工程系和部门的遗传学 圣路易斯华盛顿大学 63130 - 4899年圣路易斯,密苏里州,美国 编者:托尔斯滕Joachims 文摘 给定一个矩阵的值行对应于对象和列对象的特性,重排聚类的问题重新安排的行矩阵,这样相邻行之间的相似之处是最大化的总和。被各种名称多次改造,这种聚类技术已经广泛应用于许多领域在过去的30年。在本文中,我们指出的两个关键问题以前被忽视。第一个陷阱是有害的重排聚类应用的时候出现对象,形成自然的集群第二个担忧是常用的相似性度量。我们提出一种算法,克服这些缺陷。该算法是基于的一个变体旅行推销员问题。它提供了一个额外的好处,因为它会自动确定集群边界。使用该算法,我们优化解决四个基准问题和2467个基因表达数据聚类问题。正如预期的那样,我们的新算法识别集群比先前发现的方法在所有5个病例。总的来说,我们的研究结果证明的好处整流的陷阱,并例证了这种集群技术的有效性。我们的代码可以在我们的网站。 关键词: 聚类、可视化数据中的模式,键能算法,旅行推销员问题,不对称集群 .介绍 科学是知识组织。智慧是有组织的生活。- Immanuel Kant聚类的目的是发现给定数据集的结

文档评论(0)

1亿VIP精品文档

相关文档