对抗过拟合:cGAN应用于策略调参

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 金工 对抗过拟合:cGAN 应用于策略调参 华泰研究 研究员 林晓明 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +86-755-82080134 研究员 何康,PhD SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +86-21-28972039 研究员 李子钰 SAC No. S0570519110003 liziyu@htsc.com +86-755-23987436 联系人 陈伟 SAC No. S0570121070169 chenwei018440@htsc.com 中债-国债总净价(总值)指数择时-多空(2011/12/30-2021/10/08) 资料来源:Wind,华泰研究 2021 年 10 月 12 日│中国内地 深度研究 cGAN 生成模拟样本为应对策略参数过拟合提供新思路 本文构建了基于生成对抗网络的量化策略参数调优框架,为应对策略过拟合提供了新思路。传统基于单一历史路径进行参数调优的方法存在较高过拟合风险,而 cGAN 生成的拟真样本则可以对备选参数进行批量回测,通过观察备选参数的大样本统计表现来决定样本外所使用的参数。基于大数定律,在大样本模拟路径上的回测可以降低偶然因素对参数表现的影响,回归参数的本质表现,进而辨别参数的优劣。实证结果表明,cGAN 生成样本对备选参数具有较为明显的区分能力,基于 cGAN 的择时策略表现优于传统方法。 基于历史数据的参数调优可能由于路径随机与时序随机而产生过拟合 首先,在随机过程的视角下,资产历史数据只是随机过程的一条实现路径,仅在历史数据上进行回测无法观察到备选参数在潜在路径上的表现,这种路径随机性偏差可能导致历史回测的最优参数并不是“过去的最优解”。其次,样本内外的切分点可能位于市场规律或风格变换的“阵痛期”,因此样本内的最优参数无法捕捉变换后的市场规律或风格,这种时序随机性偏差可能导致“过去的最优解”不是“未来的最优解”。路径随机与时序随机的偏差相叠加容易带来参数过拟合的问题。 构建基于 cGAN 的参数调优框架 基于 cGAN 的参数调优框架包括以下步骤:1.以资产历史收益率序列为条件,训练 cGAN 生成大量未来的模拟收益率序列;2.采用自相关性、偏自相关性、厚尾分布、波动率聚集等指标来验证资产模拟收益率序列的拟真性;3.令备选参数在所有模拟路径上进行回测,计算各个参数的回测统计表现,由于备选信号与模拟路径数量级较高,回测时采用 numba 等加速包对回测流程加速;4.根据备选参数的统计表现选择在“模拟未来”整体表现更为稳健的参数应用于真实的未来,实际操作时可以选择多组表现稳健的备选参数进行信号集成。 利率债指数趋势择时实证:基于 cGAN 的方法优于传统方法 本文以中债-国债总净价(总指)指数为标的进行基于 cGAN 参数调优的趋势择时数据实证。具体回测时,采取每两年滚动的方式进行策略构建,即每两年年末训练 cGAN,生成 500 条未来 2 年的模拟路径并对备选信号进行回测,选择统计表现最稳健的参数应用于未来 2 年择时,调仓频率为周频。实证结果表明,模拟路径对备选信号具有较强的区分能力,基于模拟路径进行备选参数选择是合理的。在全部回测区间内,多空择时夏普比率 1.85,历史最大回撤 3.54%;多空择时总调仓次数为 38 次,平均每年调仓 4.00次,多头端平均每次持仓 65.95 天,空头端平均每次持仓 54.95 天。 探讨回测参数、随机数种子对策略的影响及在其他标的上的测试 最后本文对策略构建中的参数及随机数种子点进行讨论:策略参数主要为每个截面期从备选参数里选择的参数数量,本文所有的备选参数为 277 组,我们测试了表现靠前的 N=130、140、150、160、170 的回测结果,以及不同随机数种子点的结果,结果表明策略较为稳健。在其他指数上的测试结果表明基于 cGAN 调参的方法回测效果也较好,且 cGAN 有更低的过拟合概率。 风险提示:cGAN 模型存在黑箱问题,训练不收敛不同步,以及模式崩溃问题。深度学习模型存在过拟合的可能。深度学习模型是对历史规律的总结,如果历史规律发生变化,模型存在失效的可能。cGAN 策略调参框架会受到底层信号失效的影响。 0.91.11.31.52011-12-302012-12-302013-12-302014-12-302015-12-302016-12-302017-12-302018-12-302019-12-302020-12-30基于cGAN调参的择时净值-多空基于历史调参的择时净值-多空中债国债总净价指数 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 研究导读 ....................................................................................................................................................................... 4 应对过拟合:利用 cGAN 构建模拟未来 ....................................................................................................................... 5 过拟合的困境 ........................................................................................................................................................ 5 利用条件生成对抗网络构建模拟未来 .................................................................................................................... 6 cGAN 的基本原理 .......................................................................................................................................... 6 cGAN 构建模拟未来的合理性 .......................................................................................................

立即下载
金融
2021-10-26
华泰证券
30页
2.17M
收藏
分享

[华泰证券]:对抗过拟合:cGAN应用于策略调参,点击即可下载。报告格式为PDF,大小2.17M,页数30页,欢迎下载。

本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
ETF 分类资金流情况
金融
2021-10-26
来源:仓位和资金流:资金流向体现类滞胀避险特征,行业配置高切低
查看原文
ETF 总份额增长前十
金融
2021-10-26
来源:仓位和资金流:资金流向体现类滞胀避险特征,行业配置高切低
查看原文
公募基金仓位
金融
2021-10-26
来源:仓位和资金流:资金流向体现类滞胀避险特征,行业配置高切低
查看原文
南向资金过去一个月持股市值变动
金融
2021-10-26
来源:仓位和资金流:资金流向体现类滞胀避险特征,行业配置高切低
查看原文
沪港通南向近一年累计净流入 图 27:深港通南向近一年累计净流入
金融
2021-10-26
来源:仓位和资金流:资金流向体现类滞胀避险特征,行业配置高切低
查看原文
北向席位行业 ETF 轮动-双周频 图 24:北向席位行业 ETF 轮动-五周频
金融
2021-10-26
来源:仓位和资金流:资金流向体现类滞胀避险特征,行业配置高切低
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起