金工-GPT因子工厂2.0:基本面与高频因子挖掘

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 金工 GPT 因子工厂 2.0:基本面与高频因子挖掘 华泰研究 研究员 林晓明 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +(86) 755 8208 0134 研究员 何康,PhD SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +(86) 21 2897 2202 联系人 沈洋 SAC No. S0570123070271 shenyang023029@htsc.com +(86) 21 2897 2228 高频合成因子中证 1000 指增净值 注:股票池:中证全指成分股;回测区间:2016-12-30至 2024-09-20;交易费率双边 3‰;周调仓单边换手率上限 20%;优化器约束条件:80%成分内选股,行业偏离约束±2%,市值偏离约束±0.2 资料来源:Wind,OpenAI,华泰研究 2024 年 9 月 26 日│中国内地 深度研究 人工智能 82:GPT 因子工厂扩展至基本面与高频因子挖掘 本研究在前期报告《GPT 因子工厂:多智能体与因子挖掘》(20240220)的基础上,将大模型因子挖掘扩展至基本面与高频因子挖掘场景。本文继续沿用前期报告中的多智能体架构,核心改变在于针对基本面与高频因子定制化设计算子,以尽可能保证因子表达式的合乎逻辑。在基本面因子挖掘中,因子周度 IC 均值为 0.011,周度 RankIC 均值为 0.013;对于高频因子挖掘,因子周度 IC 均值为 0.020,周度 RankIC 均值为 0.031,GPT 因子工厂 2.0挖掘高频因子质量较高。利用 GPT 因子工厂 2.0 产出的高频因子构建中证1000 指增策略(回测区间 20161230- 20240920),年化超额收益率为31.32%,信息比率为 4.20。 因子挖掘与 GPT 因子工厂:大模型因子挖掘或成为因子挖掘新兴方案 因子挖掘在量化研究中占据核心地位,是为多因子模型补充 Alpha 源的重要途径。传统的因子挖掘主要包括人工手动挖掘和算法自动挖掘两种方案:人工手动挖掘依赖于量化研究员对市场的理解与直觉,离不开研究员的专业素养,需消耗高昂的人力成本;算法自动挖掘将因子挖掘流程自动化,有效降低人力成本,然而其缺陷是过拟合风险与可解释性难题。大模型因子挖掘或将成为新兴的因子挖掘方案,其可行性在前期报告中已得到证明,同时大模型可给予清晰的逻辑解释,过拟合风险或更可控。 基本面与高频因子挖掘:或是自动化因子挖掘难涉之境 算法自动化因子挖掘相比于人工挖掘存在诸多优势,但却鲜有针对基本面或高频因子的自动化因子挖掘,人工挖掘因子似乎更具优势。对于基本面因子挖掘而言,传统算法在无法利用专业知识的前提下,难以构造具备逻辑性的基本面因子。对于高频因子而言,传统算法可能难以在表达式中融入日频化采样,高频因子表达式的复杂性形成一道隐形的墙。大模型或许是解决之道,一方面在于大模型近乎人类的逻辑推理能力,另一方面在于,从自然语言中诞生的大模型拥有更灵活的因子构建与因子计算能力。 因子挖掘效果:基本面因子表现尚可,高频因子效果优异 本文对 GPT 因子工厂 2.0 产出的基本面因子和高频因子挖掘效果进行测试,分别进行 30 次因子挖掘,每次因子挖掘仅包括首次挖掘。因子 IC 方面,30 个基本面因子 IC 均值为 0.011,RankIC 均值为 0.013,|𝑡|均值为 1.542;23 个筛选后的高频因子 IC 均值为 0.020,RankIC 均值为 0.031,|𝑡|均值为4.588。因子相关性方面,基本面因子相关系数绝对值均值为 0.10,高频因子相关系数绝对值均值为 0.17,因子工厂产出的因子相关性普遍偏低。 指数增强策略实践:基于量价与高频因子的指增策略均表现较出色 本文基于量价和高频因子分别进行指增策略实践检验。对于前期报告初次挖掘产出的量价因子,沪深 300、中证 500、中证 1000 指增策略年化超额收益率分别为 7.18%、10.34%、18.50%,对于高频因子,三类指增年化超额分别为 13.78%、18.40%、31.32%。将合成后的量价因子与高频因子按 1:4权重合并,合并后因子三类指增年化超额分别为 12.38%、17.74%、30.72%。指增策略实践表明,GPT 因子工厂产出的高频因子效果总体优于量价因子,基于高频因子可构建效果较出色的指增策略。 风险提示:GPT 挖掘因子是对历史的总结,具有失效风险。GPT 挖掘因子可解释性受限,使用需谨慎。大模型训练集广泛,可能存在过拟合风险。 -30%-25%-20%-15%-10%-5%0%0123456782016-12-302017-05-302017-10-302018-03-302018-08-302019-01-302019-06-302019-11-302020-04-302020-09-302021-02-282021-07-312021-12-312022-05-312022-10-312023-03-312023-08-312024-01-312024-06-30超额收益回撤(右轴)策略净值中证1000指数基准累计超额收益 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 导言 .............................................................................................................................................................................. 4 大语言模型与因子挖掘 ................................................................................................................................................. 5 基于大模型的因子挖掘 .......................................................................................................................................... 6 基本面与高频因子挖掘 .......................................................................................................................................... 7 方法 .

立即下载
综合
2024-09-30
华泰证券
29页
2.22M
收藏
分享

[华泰证券]:金工-GPT因子工厂2.0:基本面与高频因子挖掘,点击即可下载。报告格式为PDF,大小2.22M,页数29页,欢迎下载。

本报告共29页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共29页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
资金分层可以部分解释同业存单的估值变动
综合
2024-09-30
来源:债市进一步下探的动力和阻力
查看原文
政府存款 2024 年 5 月份开始同比多增
综合
2024-09-30
来源:债市进一步下探的动力和阻力
查看原文
今年以来居民存款-贷款同比增速差不断走扩
综合
2024-09-30
来源:债市进一步下探的动力和阻力
查看原文
保险企业保费收入累计同比增速
综合
2024-09-30
来源:债市进一步下探的动力和阻力
查看原文
今年 8 月规模以上工业增加值和服务业生产指数走弱(%)
综合
2024-09-30
来源:债市进一步下探的动力和阻力
查看原文
今年 8 月规模以上工业增加值环比走弱
综合
2024-09-30
来源:债市进一步下探的动力和阻力
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起