金工:以空间换时间——多目标基本面选股因子挖掘框架

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 金工 以空间换时间——多目标基本面选股因子挖掘框架 华泰研究 林晓明 研究员 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +(86) 755 8208 0134 徐特*,PhD 研究员 SAC No. S0570523050005 xute@htsc.com +(86) 10 6321 1166 何康,PhD 研究员 SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +(86) 21 2897 2202 孙浩然*,PhD 联系人 SAC No. S0570124070018 sunhaoran@htsc.com +(86) 21 2897 2201 基本面因子全成分内中证 1000 指增 注:回测区间 2019-12-31 至 2025-07-31,模型每季度末重训练,全成分内选股,双周频调仓 资料来源:Wind,华泰研究 2025 年 8 月 11 日│中国内地 深度研究 人工智能 95:构建多目标遗传算法,挖掘基本面选股因子 经过前期报告对因子计算和评价过程的 GPU 加速、对因子评价维度的扩充和对种群多样性的提升后,我们团队的因子挖掘框架相较传统的单目标遗传规划已经“脱胎换骨”。本文将其应用于基本面选股因子挖掘,获得了分组单调性较好、|IC|胜率较高、多头组表现亮眼的因子。尤其是在全成分内中证 1000 指增上,基本面合成因子的扣费后年化超额收益高达 32.5%。其令人惊喜的表现说明中证 1000 成分股的基本面信息依然具有丰富的 α。基本面合成因子和“舆情分诊台”量价因子的长期相关性仅为 0.07。 将基本面因子的表达式参数化,使用多目标遗传算法开展优化 为了提升基本面因子的可解释性,我们用 11 个参数来约束因子表达式的格式,而不再用树状结构来表达因子。相应地,因子挖掘框架从遗传规划退变为通用的遗传算法,可以不再依赖 deap 等包执行。为了提升因子种群多样性,进而提升因子种群对抗过拟合的性能,我们同时引入三维因子评价指标——|IC|评价因子分组单调性,|IC|胜率评价因子时序稳定性,NDCG@k 评价因子多头组表现。NSGA-II 算法能在不对三者加权的前提下,对因子进行优劣排序和选取。为了能够在相对“廉价”的硬件上高效完成因子挖掘,我们还做了内存和显存管理,实现了“以空间换时间”的效果。 对基本面指标开展较精细的预处理,得到 71 个指标作为因子挖掘输入 因子挖掘输入指标涵盖市场表现、分析师一致预期、三大财务报表科目。大部分财报指标有当季值(MRQ)和滚动四个季度之和(TTM)两种呈现方式。考虑到传统价值因子存在分子分母错配问题,我们引入企业价值指标,将其作为价值因子分母的备选;考虑到业绩预告或业绩快报的信息更及时,我们将其和正式财报中的相关指标融合;考虑到出于会计谨慎性而费用化的研发支出在未来可能会给企业带来丰厚的回报,我们将研发费用加回利润总额类科目;考虑到一致预期指标在年报发布前后会出现数值和含义的双重跳变,我们对其进行了重构;我们根据预测机构评级,计算了个股综合评级得分。 基本面合成因子分组单调性较好、|IC|胜率较高、多头组表现亮眼 每季度末重新挖掘因子,结合贪心策略和共线性排除,选取验证集上表现最好的一批因子,合成最终的基本面选股因子。取回测区间为 2019-12-31 至2025-07-31,开展双周频调仓。在沪深 300、中证 500、中证 1000 共 1800只成分股的十分组测试中,合成因子多头组表现相较其余九组较为亮眼,脱离了空头 α“陷阱”。在全成分内指数增强测试中,沪深 300、中证 500 和中证 1000 指增在考虑双边 3‰的手续费后,分别取得了 10.1%、13.6%和32.5%的年化超额收益。长期来看,合成因子偏好高盈利、强反转、大市值和低换手的成分股,比较符合价值投资的理念。 风险提示:遗传算法在滚动窗口中挖掘历史规律,规律可能会在下次重训练之前失效;遗传算法作为一类机器学习方法,可能存在过拟合问题;基本面模型有其适用的市场条件,无法保证在任何市场条件下均可取得超额收。 0.61.01.41.82.22.63.03.43.84.24.65.00.51.01.52.02.53.03.54.04.55.05.56.0202020212022202320242025中证1000基准中证1000增强净值比(右轴)000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 基本面选股因子挖掘框架 .............................................................................................................................................. 3 因子格式规定 ........................................................................................................................................................ 3 因子评价指标 ........................................................................................................................................................ 3 因子挖掘流程 ........................................................................................................................................................ 4 NSGA-II 算法原理 ......................................................................................................................................... 5 内存、显存

立即下载
综合
2025-08-18
华泰证券
21页
1.92M
收藏
分享

[华泰证券]:金工:以空间换时间——多目标基本面选股因子挖掘框架,点击即可下载。报告格式为PDF,大小1.92M,页数21页,欢迎下载。

本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
国金证券大类因子分类
综合
2025-08-18
来源:量化观市:当前微盘股的风险指标到什么位置了?
查看原文
可转债择券因子多空净值 图表20:可转债择券因子 IC 均值与多空净值
综合
2025-08-18
来源:量化观市:当前微盘股的风险指标到什么位置了?
查看原文
一致预期、市值、成长和反转因子多空净值(全部 A 股)
综合
2025-08-18
来源:量化观市:当前微盘股的风险指标到什么位置了?
查看原文
大类因子的 IC 均值与多空收益
综合
2025-08-18
来源:量化观市:当前微盘股的风险指标到什么位置了?
查看原文
宏观择时模型净值表现 图表15:宏观择时模型超额收益表现
综合
2025-08-18
来源:量化观市:当前微盘股的风险指标到什么位置了?
查看原文
宏观择时模型最新观点(截至 7 月 30 日)
综合
2025-08-18
来源:量化观市:当前微盘股的风险指标到什么位置了?
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起