因子选股系列之九十:DFQ遗传规划价量因子挖掘系统

有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 金融工程 | 专题报告 研究结论 ⚫ 国内量化发展已有十余年,各家机构投资者的 alpha 因子库已有较大规模,传统人工构建 alpha 因子的方法已遇到瓶颈。为了对人工因子库进行补充,我们在传统alpha 模型的体系下引入遗传规划方法,将挖掘因子的部分交给机器。 ⚫ 此次我们对遗传规划算法进行了全面升级,开发出了一套高效的 DFQ 遗传规划价量因子挖掘系统。加入自定义的特征和算子,指定适应度指标,从一个随机种群出发,可以通过多代进化得到更优子代。挖掘过程可以重复多轮,从而可以得到多个适应度高、低相关、有显式表达式的选股因子。 ⚫ 遗传规划算法在选股因子挖掘问题上有其难以被其他方法替代的独特优势,我们概括了 12 点优势:有着直观易懂的底层逻辑,能够自动化特征生成与选择,可以融合人工先验信息,捕捉非线性和交互效应,生成的因子具有显式表达式,可解释性强,能够实现全局优化,对噪声较为鲁棒不易过拟合。算法内部透明白盒,可拓展空间大,自由度高。是一个可持续进行的因子挖掘工具。对计算性能要求相对低。应用广泛,既可以挖掘单因子使用,也可以将挖掘出的多个有效低相关的单因子进行合成,获得个股综合打分。还可以与其他机器学习模型结合,互相间并不冲突。 ⚫ 由于在进化过程中缺乏明确的目标引导,常规的遗传规划算法进化效率低下。如何能提升进化效率,在有限的算力,有限的时间内,进化出更多、更好、更短、更低相关的因子,是算法的核心痛点,也是 DFQ 模型的核心改进点。 ⚫ DFQ 模型主要有 7 点改进:提升初始种群质量,提升每代种群质量,提升每代产生的有效公式数量,避免公式膨胀,动态调整每代进化参数,降低挖掘因子的相关性,避免无效运算。 ⚫ DFQ 模型以 2012-2016 年为训练集,2017-2023 年作为样本外测试集。输入 47 个日度量价和日内分钟量价特征和 6 个常数,配合 81 个算子,以行业市值中性化 IC作为适应度,挖掘全市场月频价量因子。 ⚫ DFQ 模型挖掘效率较高,进行一轮 15 代完整挖掘用时 5-24 小时不等,一轮完成后可产生 20-50 个适应度超过 5%,且互相间相关系数不超过 50%的单因子。我们在挖掘 3 天后已找到 324 个训练集适应度超过 5%,不重复,且与人工 18 个价量因子相关性不高的单因子。其中只有 45 个在 12 年以来全样本中性化 IC 绝对值不到5%,样本外衰减率不到 14%。 ⚫ 结合挖掘出单因子样本内外的表现和逻辑性,我们精选了 10 个单因子,均满足: 12 年以来中性化 IC 绝对值达到 8%以上,中性化 ICIR 绝对值达到年化 4 以上;样本外未出现明显效果衰减,全样本 IC 不大幅低于训练集适应度;12 年以来十组多头超额收益达到 10%以上;单调性绝对值达到 99%以上;与 18 个人工因子最大相关系数低于 50%;因子原始值缺失率低于 6%;因子表达式长度低于 10。 ⚫ 在弹性网络模型下,DFQ 合成因子 17 年以来的月频 RankIC 达到 12.72%,年化ICIR5.44。合成因子 20 分组单调性较好,多头端分年表现也十分稳定,2017-2023年每年多头超额均超过 8%,17 年以来多头超额年化 13.29%,年化夏普 2.42,最大回撤仅为 3.5%,月度胜率达到 74%,月均换手单边 72%。20 年以来多头表现不降反升,多头超额收益年化提高到 14.32%。 风险提示 1. 量化模型基于历史数据分析,未来存在失效风险,建议投资者紧密跟踪模型表现。 2. 极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。 报告发布日期 2023 年 05 月 28 日 杨怡玲 yangyiling@orientsec.com.cn 执业证书编号:S0860523040002 刘静涵 021-63325888*3211 liujinghan@orientsec.com.cn 执业证书编号:S0860520080003 香港证监会牌照:BSX840 分析师情感调整分数 ASAS:——因子选股系列之八十九 2023-03-28 基于偏股型基金指数的增强方案:——因子选股系列之八十八 2023-03-06 分析师研报类 alpha 增强:——因子选股系列之八十七 2023-02-17 研报文本情感倾向因子:——《因子选股系列研究之八十六》 2022-12-06 基于财报的业绩超预期度量:——因子选股系列之八十五 2022-10-25 分析师覆盖度因子改进:——《因子选股系列研究 之 八十四》 2022-08-23 DFQ 遗传规划价量因子挖掘系统 ——因子选股系列之九十 金融工程 | 专题报告 —— DFQ 遗传规划价量因子挖掘系统 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、DFQ 遗传规划价量因子挖掘系统概述 ..................................................... 4 二、遗传规划算法介绍 ................................................................................... 6 2.1 算法原理 ...................................................................................................................... 6 2.2 算法优势 ...................................................................................................................... 7 2.3 基本流程 ...................................................................................................................... 9 三、DFQ 模型核心改进点:提升进化效率 ................................................... 11 3.1 提升初始种群质量 ...................................................................................................... 11 3.2 提升每代种群质量 ...............................................................

立即下载
金融
2023-06-09
东方证券
30页
1.35M
收藏
分享

[东方证券]:因子选股系列之九十:DFQ遗传规划价量因子挖掘系统,点击即可下载。报告格式为PDF,大小1.35M,页数30页,欢迎下载。

本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关报告
热门报告
加入社群
回顶部
报告群
公众号
小程序
在线客服
收起