华泰人工智能系列之三十四：再探_AlphaNet，结构和特征优化

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。 1 证券研究报告金工研究/深度研究 2020年08月24日林晓明 SAC No. S0570516010001 研究员 SFC No. BPY421 0755-82080134 linxiaoming@htsc.com 陈烨 SAC No. S0570518080004 研究员 SFC No. BPV962 010-56793943 chenye@htsc.com 李子钰 SAC No. S0570519110003 研究员 0755-23987436 liziyu@htsc.com 何康 SAC No. S0570118080081 联系人 021-28972039 hekang@htsc.com 1《金工: 基金评价及筛选全流程研究框架》2020.08 2《金工: 黄金大周期下半场保值功能凸显》2020.08 3《金工: 拥抱打新盛宴，详解打新收益测算》2020.08 再探 AlphaNet：结构和特征优化华泰人工智能系列之三十四本文从网络结构和特征优化的角度改进 AlphaNet，回测表现更好华泰金工前期报告《AlphaNet：因子挖掘神经网络》(2020.6.14)提出了AlphaNet-v1 模型，能以端到端的方式有效提取股票原始量价数据中的因子。然而 AlphaNet-v1 在 2019 年下半年之后表现欠佳，针对该问题，我们分别从神经网络结构和特征的角度进行改进，构建了 AlphaNet-v2 和AlphaNet-v3 两个升级模型，并在多个股票池内测试。结果显示，在全 A股和中证 800 成分股中 AlphaNet-v2 表现优于 AlphaNet-v1，在中证 500成分股中 AlphaNet-v3 表现小幅优于 AlphaNet-v2。另外，本文总结对比了“遗传规划+随机森林”模型和 AlphaNet 的优缺点。本文介绍了两个改进模型：AlphaNet-v2 和 AlphaNet-v3 的改进思路相比 AlphaNet-v1，AlphaNet-v2 改进了以下几点：(1)考虑到比率类特征的有效性，扩充了 6 个比率类特征；(2)将池化层和全连接层替换为 LSTM层，从而更好地学习特征的时序信息；(3)训练集和验证集划分从 1：1 变成 4：1，验证集更关注近期样本的表现。相比 AlphaNet-v2，AlphaNet-v3改进了以下几点：(1)扩充特征提取层，特征提取层 1 和特征提取层 2 中的运算函数具有不同的回看区间(10 和 5)；(2)将 LSTM 层替换为 GRU，减少模型参数。在全 A 股和中证 800 成分股中，AlphaNet-v2 表现优于 AlphaNet-v1 设定回测期为 20110131～20200731，调仓周期为 10 个交易日。在全 A股中，AlphaNet-v2 相比 AlphaNet-v1 的 RankIC 均值从 9.72%提升至10.76%，ICIR 从 1.00 提升至 1.15。构建相对于中证 500 的行业、市值中性的全 A 选股策略，年化超额收益率从 17.17%提升至 19.09%，信息比率从 2.73 提升至 3.13。在中证 800 成分股中，AlphaNet-v2 相比AlphaNet-v1 的 RankIC 均值从 8.37%提升至 8.63%，ICIR 从 0.73 提升至0.75。构建相对于中证 800 的行业、市值中性的选股策略，年化超额收益率从 6.19%提升至 7.84%，信息比率从 1.65 提升至 2.00。在中证 500 成分股中，AlphaNet-v3 表现小幅优于 AlphaNet-v2 设定回测期为 20110131～20200731，调仓周期为 10 个交易日。在中证500 成分股中，AlphaNet-v3 相比 AlphaNet-v2 的 RankIC 均值从 9.05%提升至 9.70%，ICIR 从 0.89 提升至 1.00。构建相对于中证 500 的行业、市值中性的选股策略，年化超额收益率从 9.40%提升至 9.75%，信息比率从2.19 提升至 2.30。本文总结对比了 AlphaNet 和“遗传规划+随机森林”模型的优缺点 AlphaNet 和“遗传规划+随机森林”模型都是基于量价数据的人工智能选股模型，本文对比了二者的优缺点。AlphaNet 的优点是：端到端学习使得因子挖掘和因子合成使用同一目标函数进行优化，且无需维护因子池，从而无需做大量的单因子测试、因子相关性分析、因子中性化等工作。另外，只需按情况对网络结构做一定调整，就可针对任意的股票池、预测周期、数据频率构建预测模型，省时省力。AlphaNet 的缺点是：模型可解释性较低，目前可嵌入神经网络的特征提取层还比较有限，没有覆盖遗传规划中全部因子计算函数。“遗传规划+随机森林”模型的优缺点则正好相反。风险提示：通过人工智能模型构建的选股策略是历史经验的总结，存在失效的可能。神经网络受随机性影响较大，可解释性较低，使用需谨慎。相关研究金工研究/深度研究 | 2020 年 08 月 24 日免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。 2 正文目录本文研究导读 .................................................................................................................... 5 从 AlphaNet-v1 到 AlphaNet-v2 和 AlphaNet-v3 ............................................................... 6 改进说明 1：扩充比率类特征 .................................................................................... 9 改进说明 2：将池化层和全连接层替换为 LSTM/GRU 层........................................ 10 “遗传规划+随机森林”模型和 AlphaNet 的对比 ........................................................... 11 AlphaNet 模型测试流程 .................................................................................................. 12 数据准备 .................................................................................................................. 12 AlphaNet 训练和预测方式 .................

立即下载

信息科技

2020-09-06

华泰证券

25页

2.08M

[华泰证券]:华泰人工智能系列之三十四：再探_AlphaNet，结构和特征优化，点击即可下载。报告格式为PDF，大小2.08M，页数25页，欢迎下载。

本报告共25页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共25页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

华泰人工智能系列之三十四：再探_AlphaNet，结构和特征优化

关于我们

联系我们

华泰人工智能系列之三十四：再探_AlphaNet，结构和特征优化

关于我们

联系我们

小程序

公众号