金工深度研究:多角度改进高频量价选股模型

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 金工 多角度改进高频量价选股模型 华泰研究 研究员 林晓明 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +(86) 755 8208 0134 研究员 何康,PhD SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +(86) 21 2897 2202 联系人 卢炯,CFA SAC No. S0570123070272 lujiong@htsc.com +(86) 755 8249 2388 改进因子的分层相对净值 资料来源:Wind,华泰研究 2025 年 3 月 21 日│中国内地 深度研究 人工智能 89:从因子端、模型端、标签端改进高频量价选股模型 随着市场微观结构研究的深入,高频量价数据在量化投资中的重要性日益凸显。传统的人工挖掘因子和简单模型方法难以充分捕捉高频数据中的复杂规律。本文从因子端、模型端、标签端三个角度,探讨对前期高频量价模型的改进:在因子端引入大语言模型生成的分钟线、等量 K 线和 tick 因子,以更全面地捕捉市场信息;在模型端采 用 Transformer 架构,并借鉴iTransformer 和 Crossformer 模型,通过引入变量间注意力机制,提升对高频数据的表征能力;在标签端将预测目标从未来 10 日总收益调整为未来 10日逐日收益序列,以提供更细粒度的投资信号。 改进方向一:引入大语言模型生成因子 我们利用大语言模型,分别基于分钟线、等量 K 线和 tick 数据各生成 100个因子。其中,分钟线因子刻画了股票日内收益、价格波动、成交分布、量价相关性等特征;等量 K 线因子反映了股票在均匀成交量下的价格趋势、价格波动、收益分布等特征;tick 因子则捕捉了股票流动性、订单不平衡等特征。实证结果表明,相比于人工特征集,基于 GPT 特征集训练的深度学习因子在多个指标上表现更优,2017 年初至 2025 年 2 月底的周度 RankIC达 11.18%,全 A 多头年化超额收益为 25.51%,在 80%成份股和无成份股约束场景下构建中证 1000 指数增强组合,年化超额收益分别达到 19.08%和 20.67%,信息比率分别为 3.26 和 2.81。 改进方向二:引入变量间注意力 Transformer 通过多头注意力捕捉输入序列中不同位置间的依赖关系;iTransformer 创新性地将时间序列维度反转,通过自注意力机制捕捉变量间的相关性;Crossformer 则通过两阶段注意力机制,同时捕捉多变量时间序列 中 跨 时 间 和 跨 维 度 的 复 杂 关 系 。 回 测 结 果 显 示 , iTransformer 和Crossformer 训练得到的因子在 RankICIR 和多头信息比率上均优于传统Transformer 模型。三类模型集成后的复合因子表现更为突出,周度 RankIC提升至 11.64%,全 A 多头年化超额收益达 25.94%,中证 1000 指数增强组合在 80%成份股和无成份股约束场景下的年化超额收益分别达到 20.25%和 21.31%,信息比率分别为 3.60 和 3.18。 改进方向三:引入收益序列预测 与直接预测总收益相比,逐日收益序列预测能够更好地捕捉市场短期波动特征,提供更细粒度的投资信号,同时充分利用了更高信息密度的标签数据。在收益序列预测场景中,Transformer 的 decoder 模块通过掩码多头注意力机制,在避免未来信息泄露的前提下学习目标序列间的依赖性,并通过多头注意力学习输入序列和目标序列之间的关联。测试结果表明,decoder 能够相对有效预测未来 10 日的逐日收益,但简单求和的方式可能会造成信息损失,其单因子测试和指数增强效果均不及传统的总收益预测模型。未来可探索多周期优化等更合适的应用场景,以充分发挥收益序列预测的优势。 风险提示:大模型生成的因子在回测中存在引入未来信息的风险。高频量价模型对市场微观结构的依赖较强,未来市场变化可能导致模型失效。Transformer 架构的复杂性会带来训练和推理时间增加,以及过拟合风险。 024682017/012018/012019/012020/012021/012022/012023/012024/012025/01第1层第2层第3层第4层第5层第6层第7层第8层第9层第10层000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 研究导读 ....................................................................................................................................................................... 4 因子端:引入大语言模型生成因子 ............................................................................................................................... 6 因子构建................................................................................................................................................................ 6 因子训练................................................................................................................................................................ 6 因子测试..........................................................................................................................................................

立即下载
综合
2025-04-01
华泰证券
23页
2.17M
收藏
分享

[华泰证券]:金工深度研究:多角度改进高频量价选股模型,点击即可下载。报告格式为PDF,大小2.17M,页数23页,欢迎下载。

本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
2024 年部分省(直辖市、自治区)土地出让收入相较于近年来最高点的累计降幅
综合
2025-04-01
来源:【粤开宏观】1998-2024年中国各省份土地出让收入排名变迁
查看原文
2024 年部分省(直辖市、自治区)土地出让收入同比增速
综合
2025-04-01
来源:【粤开宏观】1998-2024年中国各省份土地出让收入排名变迁
查看原文
2024 年部分省(直辖市、自治区)土地出让收入情况
综合
2025-04-01
来源:【粤开宏观】1998-2024年中国各省份土地出让收入排名变迁
查看原文
2023 年各省(直辖市、自治区)土地出让收入情况
综合
2025-04-01
来源:【粤开宏观】1998-2024年中国各省份土地出让收入排名变迁
查看原文
2022 年各省(直辖市、自治区)土地出让收入情况
综合
2025-04-01
来源:【粤开宏观】1998-2024年中国各省份土地出让收入排名变迁
查看原文
2021 年各省(直辖市、自治区)土地出让收入情况
综合
2025-04-01
来源:【粤开宏观】1998-2024年中国各省份土地出让收入排名变迁
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起