华泰人工智能系列之三十四:再探_AlphaNet,结构和特征优化
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 金工研究/深度研究 2020年08月24日 林晓明 SAC No. S0570516010001 研究员 SFC No. BPY421 0755-82080134 linxiaoming@htsc.com 陈烨 SAC No. S0570518080004 研究员 SFC No. BPV962 010-56793943 chenye@htsc.com 李子钰 SAC No. S0570519110003 研究员 0755-23987436 liziyu@htsc.com 何康 SAC No. S0570118080081 联系人 021-28972039 hekang@htsc.com 1《金工: 基金评价及筛选全流程研究框架》2020.08 2《金工: 黄金大周期下半场保值功能凸显》2020.08 3《金工: 拥抱打新盛宴,详解打新收益测算》2020.08 再探 AlphaNet:结构和特征优化 华泰人工智能系列之三十四 本文从网络结构和特征优化的角度改进 AlphaNet,回测表现更好 华泰金工前期报告《AlphaNet:因子挖掘神经网络》(2020.6.14)提出了AlphaNet-v1 模型,能以端到端的方式有效提取股票原始量价数据中的因子。然而 AlphaNet-v1 在 2019 年下半年之后表现欠佳,针对该问题,我们分别从神经网络结构和特征的角度进行改进,构建了 AlphaNet-v2 和AlphaNet-v3 两个升级模型,并在多个股票池内测试。结果显示,在全 A股和中证 800 成分股中 AlphaNet-v2 表现优于 AlphaNet-v1,在中证 500成分股中 AlphaNet-v3 表现小幅优于 AlphaNet-v2。另外,本文总结对比了“遗传规划+随机森林”模型和 AlphaNet 的优缺点。 本文介绍了两个改进模型:AlphaNet-v2 和 AlphaNet-v3 的改进思路 相比 AlphaNet-v1,AlphaNet-v2 改进了以下几点:(1)考虑到比率类特征的有效性,扩充了 6 个比率类特征;(2)将池化层和全连接层替换为 LSTM层,从而更好地学习特征的时序信息;(3)训练集和验证集划分从 1:1 变成 4:1,验证集更关注近期样本的表现。相比 AlphaNet-v2,AlphaNet-v3改进了以下几点:(1)扩充特征提取层,特征提取层 1 和特征提取层 2 中的运算函数具有不同的回看区间(10 和 5);(2)将 LSTM 层替换为 GRU,减少模型参数。 在全 A 股和中证 800 成分股中,AlphaNet-v2 表现优于 AlphaNet-v1 设定回测期为 20110131~20200731,调仓周期为 10 个交易日。在全 A股中,AlphaNet-v2 相比 AlphaNet-v1 的 RankIC 均值从 9.72%提升至10.76%,ICIR 从 1.00 提升至 1.15。构建相对于中证 500 的行业、市值中性的全 A 选股策略,年化超额收益率从 17.17%提升至 19.09%,信息比率从 2.73 提升至 3.13。在中证 800 成分股中,AlphaNet-v2 相比AlphaNet-v1 的 RankIC 均值从 8.37%提升至 8.63%,ICIR 从 0.73 提升至0.75。构建相对于中证 800 的行业、市值中性的选股策略,年化超额收益率从 6.19%提升至 7.84%,信息比率从 1.65 提升至 2.00。 在中证 500 成分股中,AlphaNet-v3 表现小幅优于 AlphaNet-v2 设定回测期为 20110131~20200731,调仓周期为 10 个交易日。在中证500 成分股中,AlphaNet-v3 相比 AlphaNet-v2 的 RankIC 均值从 9.05%提升至 9.70%,ICIR 从 0.89 提升至 1.00。构建相对于中证 500 的行业、市值中性的选股策略,年化超额收益率从 9.40%提升至 9.75%,信息比率从2.19 提升至 2.30。 本文总结对比了 AlphaNet 和“遗传规划+随机森林”模型的优缺点 AlphaNet 和“遗传规划+随机森林”模型都是基于量价数据的人工智能选股模型,本文对比了二者的优缺点。AlphaNet 的优点是:端到端学习使得因子挖掘和因子合成使用同一目标函数进行优化,且无需维护因子池,从而无需做大量的单因子测试、因子相关性分析、因子中性化等工作。另外,只需按情况对网络结构做一定调整,就可针对任意的股票池、预测周期、数据频率构建预测模型,省时省力。AlphaNet 的缺点是:模型可解释性较低,目前可嵌入神经网络的特征提取层还比较有限,没有覆盖遗传规划中全部因子计算函数。“遗传规划+随机森林”模型的优缺点则正好相反。 风险提示:通过人工智能模型构建的选股策略是历史经验的总结,存在失效的可能。神经网络受随机性影响较大,可解释性较低,使用需谨慎。 相关研究 金工研究/深度研究 | 2020 年 08 月 24 日 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 正文目录 本文研究导读 .................................................................................................................... 5 从 AlphaNet-v1 到 AlphaNet-v2 和 AlphaNet-v3 ............................................................... 6 改进说明 1:扩充比率类特征 .................................................................................... 9 改进说明 2:将池化层和全连接层替换为 LSTM/GRU 层........................................ 10 “遗传规划+随机森林”模型和 AlphaNet 的对比 ........................................................... 11 AlphaNet 模型测试流程 .................................................................................................. 12 数据准备 .................................................................................................................. 12 AlphaNet 训练和预测方式 .................
[华泰证券]:华泰人工智能系列之三十四:再探_AlphaNet,结构和特征优化,点击即可下载。报告格式为PDF,大小2.08M,页数25页,欢迎下载。
