机器学习视角下的考察:因子拥挤度指标及其择时作用
敬请阅读末页的重要说明 证券研究报告 | 金融工程 专题报告 因子拥挤度指标及其择时作用 2020 年02 月02 日 机器学习视角下的考察 市值因子多空净值和拥挤度指标 资料来源:Wind 资讯、招商证券定量研究团队整理 相关报告 《利用 XGBoost 预测规模因子收益方向》 《利用 LSTM 算法估计基金因子暴露度》 美国市场对于因子拥挤度指标的重视源于 2009 年动量因子(Momentum Factor)的大幅回撤,研究者认为因子拥挤度可能是影响因子寿命的重要原因。在国外研究的基础上,我们构建了估值价差、配对相关性、因子波动率、因子长期反转等 8 个因子拥挤度指标,并分别用这些指标对单因子收益方向和多因子组合权重进行了择时。在单因子择时方面,我们使用了 XGBoost 和 LSTM 两种机器学习算法,但是并没有取得明显优于纯做多方式的结果。我们又使用合成指标对多因子模型的权重进行调整,最后根据拥挤度指标加权后的多因子模型小幅战胜了因子等权组合的模型。 正像建筑师在设计公共建筑主体时,兼顾商业价值和美观之余,需要着重考虑所需容纳人口的拥挤度,投资者在研究因子策略的时候,需要关注现有的因子拥挤度和资金容量上限。 过多的资金追逐同一资产可能会引发尾部风险,因而国外十分重视对于因子拥挤度研究。国外的研究认为因子拥挤度指标本身并非一个因子收益的负向指标,因为必须有资金流入才能推动因子有优秀的收益表现。只有在某个时期有过多的资金聚集在某个因子上的时候,才会使得因子过于拥挤。 在国外研究的基础上,我们试图探索因子拥挤度指标是否能在国内市场上对因子进行有效择时。我们构建了 4 类描述因子拥挤度的相对值指标,分别是估值价差、配对相关性、因子波动率、因子长期反转(共 8 个指标)。在 A股市场,因子拥挤度指标对跟因子的多空收益相关性并不单调。 随后,我们分别利用了两种机器学习方法(XGBoost 和 LSTM)基于因子拥挤度指标对单因子未来一周的收益方向进行择时。调用 2009 年以来的数据作为训练和测试的样本,对每个因子分别建立预测模型,在测试集中评估模型的准确性。由于国内的因子多空收益的 Alpha 属性非常显著,利用模型对单因子收益方向进行预测的胜率并不高于每期都做多的简单策略的准确性。 我们随后用主成分分析法(PCA)降维合成因子拥挤度单一指标,该指标与因子多空净值走势呈现正相关性,我们以该指标加权构建多因子组合,加权后的组合多空净值小幅战胜等权的多因子组合。 总体而言,A 股市场的因子拥挤度有一定的尾部风险警示作用,但是持续用于因子的择时效果并不突出。我们认为一个可能的原因是,A 股市场的投资者结构中个人投资者居多,个人投资者在交易的时候很难形成同一方向的合力,因而在某些时段从合成指标上看因子拥挤度较高,但是即使在最高处,可能也远远没有达到这些常用因子的资金容量上限,不足以使因子发生尾部风险事件。因而在 A 股市场,因子拥挤度指标的指示作用并不显著。 任瞳 86-755-83081468 rentong@cmschina.com.cn S1090519080004 崔浩瀚 86-21-68407276 cuihaohan@cmschina.com.cn S1090519070004 金融工程 敬请阅读末页的重要说明 Page 2 正文目录 因子拥挤度研究背景介绍 .............................................................................................. 4 因子拥挤度指标构建 ..................................................................................................... 5 公募基金持仓数据 ......................................................................................................... 6 相对值指标的构建 ......................................................................................................... 6 相对指标 1:估值价差 .................................................................................................. 7 相对指标 2:配对相关性 ............................................................................................... 8 相对指标 3:因子收益波动率 ....................................................................................... 9 相对指标 4:因子长期反转 ......................................................................................... 10 机器学习算法对单因子多空收益进行择时 .................................................................. 11 XGBoost 算法预测单因子收益 .................................................................................... 11 特征变量和标签数据处理 ............................................................................................ 13 预测结果评估 .............................................................................................................. 13 LSTM 算法预测单因子收益......................................................................................... 13 神经网络结构 .........................................................................................................
[招商证券]:机器学习视角下的考察:因子拥挤度指标及其择时作用,点击即可下载。报告格式为PDF,大小2.22M,页数24页,欢迎下载。
