关键词:
复杂网络
社团检测
图卷积神经网络
马尔科夫稳定性
强化学习
深度Q网络
摘要:
社团检测作为复杂网络中的一项基本课题已经在很多领域得到了广泛的应用。社团检测旨在于通过分析网络的拓扑结构以及其他信息挖掘出网络的社团结构,这对于了解网络结构、分析网络特性具有极为重要的意义。在早期,一系列基于不同思想的社团检测算法被提了出来,例如标签传播、模块度优化等等。这些算法的本质都是从统计学的角度出发,通过对网络的拓扑结构进行分析,从而挖掘出网络的社团结构。近年来,随着机器学习的快速发展,社团检测算法也从当初的基于统计学的算法转向了基于机器学习的算法,很多神经网络模型例如前馈神经网络模型、卷积神经网络模型、对抗神经网络模型等都被应用在了社团检测中,并取得了显著的效果。与传统的算法相比,基于机器学习的算法能够凭据大量的数据以及神经网络强大的拟合能力挖掘出网络中节点之间的关系,进而准确地检测出网络的社团结构。近年来,研究人员将卷积神经网络扩展到了复杂网络上,并提出了一系列图卷积神经网络模型。其中图卷积神经网络(Graph Convolutional Network,GCN)模型一经提出,便由于其简洁和高效得到了研究人员广泛的关注,并被应用在了许多领域,其中就包括社团检测。与其他基于深度学习的社团检测算法相比,基于图卷积神经网络的社团检测算法能够更好地拟合网络中节点之间的拓扑关系。但是现有的基于图卷积神经网络的社团检测算法在社团挖掘的准确性上仍然面临着一些限制,这主要是因为这些算法的优化目标不能够更好表征社团结构。针对这一问题,本文从增强社团结构的马尔科夫稳定性的角度出发,提出了一种基于图卷积神经网络的重叠社团检测方法,旨在于通过图卷积神经网络模型强大的邻域信息聚合能力生成具有最高稳定性的社团结构。与现有的基于图卷积神经网络的社团检测算法相比,本文提出的算法所使用的马尔科夫稳定性更能够表征网络的社团结构。为了验证我们提出的算法的有效性,我们选取了两种衡量社团挖掘效果的评价指标,同时在一系列尺度不同的网络上进行了对比测试实验,包括小规模的真实网络、中等规模的真实网络、中等规模的属性网络以及人工生成的网络。实验结果表明,与其他的基线算法相比,我们的算法在绝大多数的网络上具有最高的准确性,同时,由于马尔科夫稳定性依赖于一个时间参数,马尔科夫时间,在实验的过程中,我们发现可以通过优化马尔科夫时间来进一步提升我们算法社团挖掘的准确性。实验结果表明在给定最优的马尔科夫时间的情况下,我们算法社团挖掘的准确性可以得到显著的提升。另一方面,一些基于模块度优化的社团检测算法由于贪心思想存在局部最优的问题。本文提出使用图卷积神经网络和强化学习来解决这一问题。其中我们使用图卷神经网络来提取网络的状态信息,使用强化学习算法深度Q网络来解决模块度优化中存在的局部最优问题。本文在一些真实网络上与一些基于模块度优化的社团检测算法进行了对比实验,实验结果表明,本文提出的算法可以避免模块度局部最优的问题,相应的社团检测准确性更高。