贾志远-21551063-第三次读书报告.docVIP

  • 9
  • 0
  • 约8.04千字
  • 约 13页
  • 2017-02-08 发布于重庆
  • 举报
贾志远-21551063-第三次读书报告

硕 士 研 究 生 读 书 报 告 题目 图聚类研究 作者姓名 贾志远 作者学号 指导教师 贝毅君 学科专业 大数据1502 所在学院 软件学院 提交日期 二○一五年十二月 Research on Graph Clustering A Dissertation Submitted to Zhejiang University in partial fulfillment of the requirements for the degree of Master of Engineering Major Subject: Software Engineering Advisor: Bei Yijun By Jia Zhiyuan Zhejiang University, P.R. China 2015 摘要 本文主要是对图聚类算法进行研究,首先介绍了聚类的定义,之后对图聚类进行了简单的解释以及将会使用哪些算法来进行图聚类,然后对图聚类中的一些专业词汇进行了解释说明,最后对划分聚类算法、层次聚类算法、密度聚类算法、网格聚类算法及模型聚类算法进行了详细讲解,同时在图聚类中会用到的一些聚类算法,例如:Mafkov聚类、谱聚类以及基于密度的聚类进行了描述,对算法的过程进行了详细阐述。 关键词:图聚类,聚类算法,Mafkov聚类,谱聚类 Abstract This paper is mainly study the graph clustering algorithm. Firstly, the paper introduces the definition of clustering, after that, the graph clustering is explained simply and what algorithm will be used. Then some professional words related to the graph clustering are explained. Finally the paper will explain the partition clustering algorithm, the hierarchical clustering algorithm, the density based clustering algorithm, the grid clustering algorithm and the clustering algorithm in detail. At the same time, it will use some kinds of clustering algorithms in the graph clustering, such as Mafkov clustering, spectral clustering and density based clustering, they will be described simply and the process of these algorithms are described in detail. Keywords:, cluster algorithms, Mafkov clustering, spectral clustering 1引言 聚类是一个将数据集划分成若干簇或类的过程,使得同一类内的数据对象具有较高的相似度,而不同类之间的数据对象具有较低的相似度[1]。现有的聚类算法大致分为:划分聚类算法、层次聚类算法、密度聚类算法、网格聚类算法及模型聚类算法等。 在聚类分析中,一种非常重要的特征模式聚类的变体就是图聚类,它是一项极富挑战性的课题。所谓图聚类是指把图中相对连接紧密的结点及其相关的边分组形成一个可以用一个抽象结点表示的子图。子图内各结点具有较高的相似性,而子图之间各结点的相似性较低[5]。 图聚类有很多不同的方式,其中具代表性的有:Mafkov聚类[2、5]、谱聚类[3]以及基于密度的聚类[4]等。其中Markov聚类的核心思想是基于模拟随机流(使用图的转移概率矩阵)进行图聚类;谱聚类是通过优化图的最小分割来进行图聚类,其中这个优化问题可以通过解一个图矩阵的特征值特征向量的方法实现;而基于密度的聚类是通过衡量一个点周围邻居的密度来进行图聚类,该算法不仅可以对图聚类,还可以识别出中心桥梁点和异常点。 2相关基本概念 这一部分主要是讲述概念性的东西,为之后的图

文档评论(0)

1亿VIP精品文档

相关文档