因子选股系列之一〇七:DFQ-XGB,基于树模型的alpha预测方案
有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 金融金融工程工程 | 专题报题报告 研究结论 树模型的训练细节 ⚫ 输入特征的构造:树模型需要人工构造特征来捕捉时间依赖性。以纯截面 70 特征为输入的模型表现,明显弱于以添加时序信息的 430 特征为输入的模型,IC 低 1pct 以上,RANKIC 低接近 2pct,ICIR 和 RANKICIR 也有较大差距,多头年化超额低 7pct 以上。 ⚫ 数据预处理方案的选择:解释变量 X 截面上进行稳健的 Zscore 标准化,减小异常值对标准化结果的影响。预测标签 Y 截面上进行 Zscore 标准化。 ⚫ 调参技巧:使用 Optuna 调参方法,调参后模型在测试集上的效果有明显提高,IC 和RANKIC 提高近 1pct,多头年化超额提高近 4pct。 ⚫ 随机种子的影响:不同种子下得到的模型表现较为接近,IC 和 RANKIC 相差都在0.5pct 以内,多头年化超额相差 2pct 以内。不同种子下得到的模型相关性很高。 ⚫ 树模型和神经网络模型的比较:相同输入特征下,MLP、GRU 模型效果均不如 XGB模型,RANKIC 低 1pct 左右。XGB 与两个网络模型的多头超额收益相关性仅 60%。 树模型的训练效果: ⚫ 因子整体绩效表现:在各个股票池中,DFQ-XGB 模型都能获得与神经网络模型相当甚至更优的绩效。在中证全指股票池中,DFQ-XGB 模型所得到因子的稳定性最强,测试集上 IC12.96%, RANKIC15.43%,20 分组多头年化超额收益 29.58%。 ⚫ 因子多头组表现:在中证全指股票池中,DFQ-XGB 模型 20 分组多头组表现整体较强,累计超额仅低于 HIST 和 FactorVAE 模型。XGB 模型和 HIST、FactorVAE 模型的多头超额净值的曲线走势存在差异,波峰波谷恰好相反,呈现出较好的互补性。 ⚫ 因子分年绩效表现:在各个股票池中,DFQ-XGB 模型 2024 年的表现都很突出,尤其多头端。在中证全指股票池中,DFQ-XGB 模型 2024 年的多头表现最优。2024 年 IC达到 15.75%,20 分组多头年化超额 35.24%,最大回撤 5.8%。 多模型集成增量: ⚫ 多模型相关性:DFQ-XGB 模型所得因子与其他模型的相关性都比较低,在中证全指股票池中,DFQ-XGB 模型与其他模型日度多头超额收益的相关性在 50%以下。 ⚫ 多模型集成表现:在中证全指股票池中,DFQ-XGB 模型与 DFQ-HIST 模型等权合成后效果更佳,达到 1+1>2 的集成效果。测试集上 IC 达到 13.39%,RANKIC 达到17.19%,20 分组多头日度超额年化收益率达到 36.12%。 Top100 组合表现: ⚫ 在中证全指内,使用 DFQ-XGB 模型构建的 top100 组合,绩效表现优于其他模型。2020 年以来年化绝对收益达到 25.68%,年化夏普比达到 1.17,最大回撤 27.28%。 指数增强组合表现: ⚫ 沪深 300 指数增强组合表现:将 XGB、dfqfactor、FactorVAE 三个模型得分,按照1:1:2 的权重结合使用,表现可超越任何一个单一模型。 2020 年以来年化信息比达到2.53,年化对冲收益 14.90%,年化跟踪误差 5.56%。 ⚫ 中证 500 指数增强组合表现:将 XGB、TRA 两个模型等权结合使用,表现可超越任何一个单一模型。2020 年以来年化信息比 2.31,年化对冲收益 17.65%。 ⚫ 中证 1000 指数增强组合表现:将 XGB、HIST 两个模型等权结合使用,表现可超越任何一个单一模型。2020 年以来年化信息比达到 3.04,年化对冲收益 24.06%。 风险提示 1. 量化模型失效风险。 2. 极端市场环境对模型的影响。 报告发布日期 2024 年 08 月 15 日 杨怡玲 yangyiling@orientsec.com.cn 执业证书编号:S0860523040002 刘静涵 021-63325888*3211 liujinghan@orientsec.com.cn 执业证书编号:S0860520080003 香港证监会牌照:BSX840 基于风险注意力的因子挖掘模型:——因子选股系列之一〇六 2024-05-29 非线性市值风控全攻略:——因子选股系列之一〇五 2024-05-27 融合基本面信息的 ASTGNN 因子挖掘模型:——因子选股系列之一〇四 2024-05-27 DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的 alpha 预测方案:——因子选股系列之一〇三 2024-05-14 基本面因子的重构:——因子选股系列之一〇二 2024-03-21 自适应时空图网络周频 alpha 模型:——因子选股系列之一〇一 2024-02-28 DFQ-HIST:添加图信息的选股因子挖掘系统:——因子选股系列之一百 2024-02-07 基于异构图神经网络的股票关联因子挖掘:——因子选股系列之九十九 2024-01-02 基于抗噪的 AI 量价模型改进方案:——因子选股系列之九十八 2023-12-24 DFQ-TRA:多交易模式学习因子挖掘系统:——因子选股系列之九十七 2023-11-14 基于残差网络的端到端因子挖掘模型:——因子选股系列之九十六 2023-08-24 DFQ 强化学习因子组合挖掘系统:——因子选股系列之九十五 2023-08-17 集成模型在量价特征中的应用:——因子选股系列之九十三 2023-07-01 基于循环神经网络的多频率因子挖掘:——因子选股系列之九十一 2023-06-06 DFQ 遗传规划价量因子挖掘系统:——因子选股系列之九十 2023-05-28 DFQ-XGB:基于树模型的 alpha 预测方案 ——因子选股系列之一〇七 金融工程 | 专题报告 —— DFQ-XGB:基于树模型的 alpha 预测方案 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、 树模型的训练细节 ............................................................................ 5 1.1 训练区间的选择 ..................................................................................................... 5 1.2 样本空间的选择 ....................................................................................................
[东方证券]:因子选股系列之一〇七:DFQ-XGB,基于树模型的alpha预测方案,点击即可下载。报告格式为PDF,大小2.11M,页数39页,欢迎下载。
