提出当前对GCN如何影响聚类效果以及如何优化GCN聚类在不同图上的效果,还不是很清楚。存在的方法都是对固定的low-order几个邻居进行gcn,弱化了节点关联信息,并且忽视了图的多样性。
这篇论文主要提出了一种自适应的图卷积方法,应用在图聚类问题上。应用了high-order的GCN来捕获全局的结构信息,并且自适应地对不同的图选择合适的order。
Introduction
- 主要还是强调了当前的方法
- 没有应用更多的节点信息
- 多数方法直接用gcn作为特征提取器,而没有研究如何让聚类效果最大化
- 低阶邻居,没有考虑大图中全局cluster结构
- 忽视了现实中图的多样性
- 出发点是
- 相邻节点更可能在同一个cluster
- 对同一个cluster的有相似特征的节点聚类会更容易
- 设计了k-order的GCN来filte node feature,得到更smooth的feature embedding,k是用intra-cluster distance自动确定
- 模型主要分两步
- k-order的GCN得到embedding
- 对embedding进行spectral clustering
- 感觉关键是能够自动选择合适的k,以及捕获全局结构信息
The Proposed Method
- 给定无向图
,V是顶点集合,有n个点,E是边表,用邻接矩阵A表示, , 。如果 可以让 通过k个边到达,就说 是 的 邻居。 - 目标是将G分成m个不相交的clusters
- 定义,graph singal
,U是拉普拉斯矩阵分解得到的 , 就是特征向量,z是各个特征向量的系数,也就是embedding, 越大表明基向量 在f中的强度越大。 - 定义,smooth是表示相邻节点在图中有相似的特征embedding。