关键词:
稀疏投资组合
K-means
分层聚类
机器学习
摘要:
稀疏投资组合对比传统的投资组合具有低交易成本、低监管成本等诸多优势,而过去构造稀疏投资组合的方法都是基于最小方差投资组合并对权重向量进行范数约束,当股票数量较大时,需要对高维协方差矩阵进行估计,而高维协方差矩阵的估计难度大、误差大,虽然过去学者提出了多种高维协方差矩阵的估计方法,但其中大部分需要对协方差矩阵的结构进行稀疏性等假定,并依赖于股票收益率的正态性以及协方差矩阵在一定时间内的稳定性,且对于众多估计方法,没有统一的评价标准,无法确定最适的高维协方差矩阵估计方法。基于此,我们提出了一种构造稀疏投资组合的创新方法,通过分行业选股将高维问题转化为低维问题。具体做法是将现有股票集按产业进行划分,包括按照现实存在的产业分类标准划分,以及采用K-means和分层聚类机器学习方法将股票重新分为新的“产业”。在基于并证实同产业股票相关性高,不同产业股票相关性低的假设下,依照不同的标准,从每个产业中筛选出至多一支股票构成我们的投资组合。为了对股票进行正确分组,充分分散行业风险暴露,我们创新性地将分组数目内生化,并提出了检验分组效果的方法,即计算出分组后的组内时变相关系数与组间时变相关系数,作出密度图比较差异,差异越大,分组效果越好。另外,区别于传统的机器学习方法,我们用1减去时变相关系数来衡量两支股票间的距离。在实证部分,受制于高维协方差矩阵估计误差,我们首先选取沪深300成分股为样本,将我们提出的12种稀疏投资组合,与4种基准投资组合进行回测,比较样本外表现,最终我们的投资组合战胜了基准投资组合,可以获得20.14%的年化收益和1.044的夏普比率。我们进一步选取主板所有股票为样本进行回测,年化收益和夏普比率可以提升至23.05%和1.154,而按照过去方法构造的稀疏投资组合失灵。通过考虑交易成本的稳健性检验,我们的优势被进一步证实。