金工机器学习专题之五:基于模型池的机器学习选股

请务必阅读正文之后的信息披露和法律声明 [Table_Main] 证券研究报告 | 金融工程专题 深度报告 金融工程专题 2022 年 5 月 24 日 金融工程专题 证券分析师 肖承志 资格编号:S0120521080003 邮箱:xiaocz@tebon.com.cn 研究助理 王成煜 邮箱:wangcy3@tebon.com.cn 相关研究 1. 《动态因子筛选——德邦金工机器学习专题之四》2022.03.09 2. 《基于财务与风格因子的机器学习选股——德邦金工机器学习专题之三》 2022.01.25 3. 《机器学习残差因子表现归因——德邦金工机器学习专题之二》 2021.11.24 4. 《利用机器学习捕捉因子的非线性效应——德邦金工机器学习专题之一》 2021.10.18 基于模型池的机器学习选股 ——德邦金工机器学习专题之五 [Table_Summary] 投资要点:  本文描述一种基于动态因子、模型筛选的量化投资方法。我们采用验证集数据打分的方式既对训练模型的因子进行筛选,也对集成模型中使用的模型进行筛选,从而尽可能使用最可能有效的因子和模型。  通过因子预筛选机制和模型的选用来加速因子筛选的过程。我们选用 LGBM 模型进行拟合和预测,并且根据模型在训练集给出的特征重要性排除一部分因子,这相对于我们在上一期提到的基于随机森林模型的筛选方法大幅度提高了效率。  维护一个动态扩大的模型池。每当训练一个新的机器学习模型,我们就将这个模型添加到模型池中。我们持续地观测模型池中各个模型的表现。  不必在每次横截面选股时都进行模型训练。用机器学习模型进行横截面选股时,不必每期重训练模型或新训练模型,而可以多加利用曾经训练的模型。这既可以在保持模型表现的基础上节约大量的运算。实际上,根据我们的回测,每月训练模型的表现并不如每个季度训练模型的表现。  单个模型的有效性通常存在轮动效应。单个模型通常在刚训练的时刻比较有效,但其有效性会随着时间衰减而逐渐失效,另一方面,一个一度失效的模型可能在未来重新变得有效,这往往是由市场风格、因子轮动效应导致的。  长记忆模型池优于短记忆模型池。开始训练模型的时间点越早,则模型池的规模越大,并且模型池整体对更长时间的市场状态有记忆,一般而言,这样的模型池的整体表现更优。  筛选近期表现良好的模型加以使用。以最近数月的数据为验证集,对模型池中的所有模型进行评价,筛选评价最高的一批模型参与构建集成模型。经验证,在过去一年中稳定有效的模型有更大的概率在未来更加有效。  众多模型的预测值的相关系数较低。我们考察了模型池中所有模型在横截面上的预测值之间的相关系数的概率密度分布,总体上相关系数不高,这有利于构造更好的集成模型。  我们对涉及到的几个主要参数和模型类型进行了敏感性分析。通过对比各参数发现模型对训练频率、验证集时间长度和模型种类的敏感性低。  因子在全市场和市值偏小的股票池中表现良好。本文构造因子阶段,以全市场的RankIC 为目标函数,因子在全市场与中证 1000 指数成分内表现良好,而在中证800 内的多头收益尚且不高。  风险提示:市场风格变化风险,模型失效风险,数据可用性风险 金融工程专题 2 / 21 请务必阅读正文之后的信息披露和法律声明 内容目录 1. 前言 ............................................................................................................................ 4 2. 方法 ............................................................................................................................ 4 2.1. 构建因子库 ........................................................................................................ 4 2.2. 因子筛选 ........................................................................................................... 4 2.2.1. 筛选因子的模型 ....................................................................................... 5 2.2.2. 筛选频率 ................................................................................................. 5 2.2.3. 因子预筛选 .............................................................................................. 5 2.2.4. 因子边际筛选 .......................................................................................... 5 2.3. 预测模型 ........................................................................................................... 6 2.3.1. 构建模型池 .............................................................................................. 6 2.3.2. 模型筛选 ................................................................................................. 7 2.3.3. 机器学习因子 .......................................................................................... 7 2.3.4. 机器学习反转因子 .................................

立即下载
金融
2022-06-01
德邦证券
21页
2.26M
收藏
分享

[德邦证券]:金工机器学习专题之五:基于模型池的机器学习选股,点击即可下载。报告格式为PDF,大小2.26M,页数21页,欢迎下载。

本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
信用利差的拐点信号今年或不成立 单位:%,%
金融
2022-06-01
来源:监管视角下的债券投资启示:拨开迷雾见月明
查看原文
短期贷款与票据融资占新增贷款比重
金融
2022-06-01
来源:监管视角下的债券投资启示:拨开迷雾见月明
查看原文
同业存款占比涨幅较快 单位: 亿元,%
金融
2022-06-01
来源:监管视角下的债券投资启示:拨开迷雾见月明
查看原文
商业银行存贷款缺口 单位:亿
金融
2022-06-01
来源:监管视角下的债券投资启示:拨开迷雾见月明
查看原文
信用利差 单位:%
金融
2022-06-01
来源:监管视角下的债券投资启示:拨开迷雾见月明
查看原文
2019 年-2022 年同业存单 1-2 月发行统计 单位:亿元
金融
2022-06-01
来源:监管视角下的债券投资启示:拨开迷雾见月明
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起