金工深度研究:基于逐笔成交的深度学习选股模型
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 金工 基于逐笔成交的深度学习选股模型 华泰研究 林晓明 研究员 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +(86) 755 8208 0134 何康,PhD 研究员 SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +(86) 21 2897 2202 卢炯,CFA 联系人 SAC No. S0570123070272 lujiong@htsc.com +(86) 755 8249 2388 融合因子的分层相对净值 资料来源:Wind,华泰研究 2025 年 7 月 14 日│中国内地 深度研究 人工智能 93:挖掘逐笔成交数据中的 alpha 高频量价数据在量化投资中的重要性毋庸置疑。本文聚焦于逐笔成交数据的信息挖掘。由于数据量庞大,逐笔成交数据难以直接作为深度学习等选股模型的输入,需依赖特征工程提取有效信号。本文从资金流和事件驱动两个角度开展特征工程,采用深度学习模型捕捉数据规律,并提出模型优化方法,最后形成选股因子。 资金流模型:tick 线、成交量线等具有时间线外的增量信息 本研究基于逐笔成交数据,构造大小单、主动买卖等资金流特征。基线模型以个股过去 40 日的 30 分钟频资金流数据作为输入,采用 transformer 模型学习时序注意力,最终输出未来 10 日超额收益的预测。然而,传统时间线存在不匹配市场交易频率、时间序列统计特性差等缺陷。改进模型在时间线基础上,拓展出 tick 线、成交量线等增量数据,并利用 transformer 模型学习跨时间和跨 k 线的规律。实证结果表明,改进模型训练的选股因子在多项指标上均优于基线模型。样本空间为全 A 股,在 2017 年初至 2025 年 6 月底的回测期内(周频调仓),因子周度 RankIC 从 10.17%提升至 10.64%,多头年化超额收益率由 20.43%提升为 22.56%。 事件驱动模型:引入跨事件注意力可提升模型性能 逐笔成交数据中的重要成交事件(如大单、价格底部、价格顶部等)可能蕴含较为丰富的信息。本研究通过识别这些特殊事件,构造相应的事件特征。基线模型以个股过去 40 日的所有事件特征作为输入,采用 transformer 模型学习时序注意力,最终输出未来 10 日超额收益的预测。改进模型则采用分层注意力机制设计,第一层 transformer 仍学习时序注意力,第二层transformer 捕捉跨事件的交叉注意力。回测结果显示,改进模型训练得到的因子在多项指标上均优于基线模型,周度 RankIC 从 9.94%提升至10.01%,多头年化超额收益率由 20.06%提升为 22.38%。 改进资金流和事件驱动因子合成的融合因子表现更佳 将改进后的资金流和事件驱动选股因子等权合成,得到逐笔成交融合因子。在 2017 年初至 2025 年 6 月底的回测期内(周频调仓),该融合因子周度RankIC 达 10.96%,多头年化超额收益率为 24.52%,表现优于单一因子。基于资金流因子、事件驱动因子和融合因子构建的中证 1000 增强组合,在相同回测期内年化超额收益率分别为 18.98%、17.24%和 19.92%,信息比率分别为 3.91、3.59 和 4.04。2025 年上半年,三者的超额收益分别为 5.57%、12.58%和 10.77%。 风险提示:基于逐笔成交数据的选股模型对市场微观结构的依赖较强,未来市场变化可能导致模型失效。Transformer 架构的复杂性可能增加训练和推理时间,并带来过拟合风险。本报告不涉及标的推荐。 024682017/012018/012019/012020/012021/012022/012023/012024/012025/01第1层第2层第3层第4层第5层第6层第7层第8层第9层第10层000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 研究导读 ....................................................................................................................................................................... 3 基于资金流的选股模型 ................................................................................................................................................. 5 基线模型................................................................................................................................................................ 5 改进模型................................................................................................................................................................ 6 因子测试................................................................................................................................................................ 7 基于事件驱动的选股模型 .............................................................................................................................................. 9 基线模型...............................
[华泰证券]:金工深度研究:基于逐笔成交的深度学习选股模型,点击即可下载。报告格式为PDF,大小1.26M,页数18页,欢迎下载。
