华泰人工智能系列之十五:人工智能选股之卷积神经网络

谨请参阅尾页重要声明及华泰证券股票和行业评级标准 1 证券研究报告金工研究/深度研究 2019年02月13日 林晓明 执业证书编号:S0570516010001 研究员 0755-82080134 linxiaoming@htsc.com 陈烨 执业证书编号:S0570518080004 研究员 010-56793942 chenye@htsc.com 李子钰 0755-23987436 联系人 liziyu@htsc.com 何康 联系人 hekang@htsc.com 1《金工: 二十载昔日重现,三四年周期轮回》2019.01 2《金工: 因子合成方法实证分析》2019.01 3《金工: 历久弥新:价值投资在国内可行否》2019.01 人工智能选股之卷积神经网络 华泰人工智能系列之十五卷积神经网络引领深度学习的发展,能够运用于多因子选股 卷积神经网络(CNN)是目前最为成熟的深度学习模型,是近年来人工智能蓬勃发展的重要推手之一,其主要特点是通过卷积和池化操作进行自动的特征提取和特征降维。本文首先通过原理分析给出了 CNN 运用于多因子选股的经验方法;然后在全 A 股票池内对 CNN 的预测结果进行单因子测试,其单因子测试结果相比对比模型具有良好表现;本文还构建了行业、市值中性全 A 选股策略并进行回测,CNN 在以中证 500 为基准的全 A 选股测试中相比对比模型表现优秀。 本文通过原理分析总结了卷积神经网络运用于多因子选股的经验方法 将卷积神经网络运用于多因子选股时,通过分析其工作原理,我们总结出以下经验:(1)股票因子数据可以组织成二维的“图片”形式,这使得 CNN具有了时间序列学习的能力。(2)当卷积核作用于股票因子数据时,本质上是在进行因子合成,因此本文只使用了一层卷积层。(3)池化层是对因子数据的“模糊化”,这对体现因子的明确意义是不利的,因此本文未使用池化层。(4)因子数据在“图片”中的排列顺序会影响到 CNN 的学习结果。 卷积神经网络合成因子的单因子测试具有良好表现 我们构建了卷积神经网络、全连接神经网络、线性回归三个模型,在2011-01-31 至 2019-1-31 的回测区间中分年度进行训练和测试,样本空间为全 A 股。从单因子测试的角度来看,CNN 合成因子的 RankIC 均值为13.62%,因子收益率均值为 1.021%,略高于全连接神经网络,也要高于线性回归。在分五层测试中,CNN 合成因子的 TOP 组合年化收益率为20.05%,夏普比率为 0.72,信息比率为 4.04,多空组合的夏普比率为 4.84,表现都要优于全连接神经网络和线性回归。 卷积神经网络在以中证 500 为基准的全 A 选股测试中表现优秀 基于卷积神经网络、全连接神经网络和线性回归,我们构建了行业、市值中性全 A 选股策略并进行回测。在 2011-01-31 至 2019-1-31 的回测区间中,当以沪深 300 为基准时,两种神经网络在年化超额收益率、信息比率和 Calmar 比率上的表现都不如线性回归。当以中证 500 为基准时,CNN的 年 化 超 额 收 益 在 13.69%~16.38% 之 间 , 超 额 收 益 最 大 回 撤 在4.80%~7.55%之间,信息比率在 2.29~2.56 之间,Calmer 比率在 2.16~2.85之间,CNN 在以上各项指标上的表现都优于另外两个模型,全连接神经网络略优于线性回归。 卷积神经网络仍有进一步研究的空间 随着 ImageNet 旗下的大规模视觉识别挑战赛(ILSVRC)连续数年的推动,卷积神经网络正在日新月异地进步中,还有诸多技术值得我们学习和尝试,例如增大训练样本数量的“数据增强”方法;ResNet 中的残差学习方法;Inception 网络中的多种尺寸卷积核混合的方法等等。此外,在高频、海量的金融数据中使用 CNN 也是一个值得尝试的方向。 风险提示:通过卷积神经网络构建的选股策略是历史经验的总结,存在失效的可能。卷积神经网络模型可解释程度较低,使用须谨慎。 相关研究 金工研究/深度研究 | 2019 年 02 月 13 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2 正文目录 本文研究导读 .................................................................................................................... 4 卷积神经网络简介 ............................................................................................................. 5 卷积神经网络的原理 .................................................................................................. 5 卷积神经网络和 ImageNet ........................................................................................ 6 卷积神经网络应用于股票多因子收益预测 ................................................................. 6 卷积神经网络选股模型测试流程 ..................................................................................... 11 测试流程 .................................................................................................................. 11 测试模型设置 .......................................................................................................... 13 卷积神经网络选股模型测试结果 ..................................................................................... 15 单因子测试 .............................................................................................................. 15 单因子回归测试和 IC 测试 ............................................................................... 15 单因子分层测试 .....

立即下载
信息科技
2019-02-21
华泰证券
21页
4.74M
收藏
分享

[华泰证券]:华泰人工智能系列之十五:人工智能选股之卷积神经网络,点击即可下载。报告格式为PDF,大小4.74M,页数21页,欢迎下载。

本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
2012-2016 国内车联网用户规模增长情况
信息科技
2019-02-20
来源:自主可控系列主题之二:北斗产业商用化有望正式开启
查看原文
高精度 GNSS 国内企业产品领域
信息科技
2019-02-20
来源:自主可控系列主题之二:北斗产业商用化有望正式开启
查看原文
2017 年国内高精度 GNSS 市场主要厂商及市场份额
信息科技
2019-02-20
来源:自主可控系列主题之二:北斗产业商用化有望正式开启
查看原文
2011-2020 国内高精度产值规模及预测
信息科技
2019-02-20
来源:自主可控系列主题之二:北斗产业商用化有望正式开启
查看原文
2014-2018 我国国防开支预算规模(亿元) 图表14: 中国军用北斗市场规模(亿元)
信息科技
2019-02-20
来源:自主可控系列主题之二:北斗产业商用化有望正式开启
查看原文
全球 GNSS 各类下游产业市场参与者十大公司排名
信息科技
2019-02-20
来源:自主可控系列主题之二:北斗产业商用化有望正式开启
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起