关键词:
社团检测
量子进化
密度峰值
进化聚类
投资组合
摘要:
复杂网络是复杂系统的抽象表示,是分析复杂系统中个体间联系以及系统整体结构的强有力工具。从小型图的分析,到大规模网络的处理,复杂网络作为新兴的跨学科研究,已经引起了诸多领域学者们的关注。社团结构普遍存在于各类复杂网络,探究复杂网络的社团结构有助于我们理解网络中的各种现象,有效的社团结构分析能够显著提高复杂系统的性能。在分析相关工作的基础上,本文从网络拓扑结构的角度出发,围绕静态网络社团检测、动态网络社团检测,以及社团检测在股票网络上的应用展开研究,主要研究内容及贡献如下:(1)提出了两种基于量子进化的静态网络社团检测算法模块度是目前广泛使用的衡量社团划分质量的度量标准,在此前提下,社团检测问题可以转化为以模块度为目标函数的寻优问题。本文将量子进化算法引入到社团检测,使用量子比特的概率幅编码方式,用量子染色体代表静态网络可能存在的社团划分,通过对量子比特的概率幅测量和坍缩的方法产生新的社团划分,在进化过程中搜索最优模块度对应的社团结构。为解决随网络规模增大产生的算法收敛速度减慢的问题,本文在前一个基于量子进化的检测算法基础上,创新性地引入一个向导量子染色体,在迭代过程中指导整个种群进化,达到快速收敛的同时,搜索更优的社团划分。两个基于量子进化的静态网络社团检测算法都能在寻优过程中自动确定社团数量,并有效发现社团结构。(2)提出一种基于扩展密度峰值聚类的静态网络社团检测算法真实的复杂网络结构中,往往存在社团尺度的显著差异,这种差异会带来社团划分中的分辨率限制问题。因此,本文定义了节点间连接强度和节点的相对连接系数,连接强度用来描述节点间的紧密度,相对连接系数用来描述节点的局部密度,连接强度和相对连接系数的定义,充分考虑节点相似度、节点间的连边、节点的度以及节点与其邻居节点各自连接强度的对比,使结构紧密的小型社团中的中心节点也能具有比较突出的相对连接系数,在社团检测的过程中更容易被发现。在基于密度峰值聚类思想选取候选中心节点的基础上,分析候选中心节点间的连接强度,剔除部分连接强度过高的候选中心节点,非中心节点则根据与已知划分的近邻节点的连接强度判断社团归属。基准网络和真实网络的实验证明,这种方法探测到的社团数目和社团结构更接近真实划分。(3)提出了一种基于连接强度和进化聚类框架的动态网络社团检测算法在动态网络中,许多基于进化聚类框架的社团检测算法都面临着平衡因子的选择问题,平衡因子的合理取值能体现出在满足时间平滑性的前提下,当前时间片与前一个时间片的社团划分存在多大程度上的关联。但目前大多数的检测算法是根据经验或者实验结果来确定这个参数,这忽略了网络拓扑结构变化所隐含的有效信息。为此,本文创新性的将节点间连接强度引入到进化聚类框架,把成本函数从社团结构的视角下推到节点间连接强度矩阵的变化,表示为相邻时间片连接强度矩阵的线性组合,并根据相邻时间片连接强度矩阵的变化幅度,动态确定平衡因子,修正当前时间片的连接强度矩阵,在此基础上使用谱方法进行划分。(4)将提出的社团检测方法应用于股票网络划分及投资组合分析金融领域中,投资的分散化可以减小投资风险,但如何选择合理的投资组合是投资者面临的重要问题。为此,本文将提出的社团检测算法应用到股票网络分析,用Pearson相关系数表示股票间的相关性,分别从中长期和短期两个角度,构建股票网络。在中长期股票网络中,通过社团划分结果和网络的拓扑结构确定投资组合,从整体上把握投资组合的方向。在短期股票网络中,对各周期的网络进行分析,及时探测网络的波动,并对投资组合方案做短期灵活调整。基于上证50指数股票网络分别进行了实证分析,证明提出的社团检测方法对投资策略及股市行业监管的有效性。