Beta猎手系列之九:人工智能全球大类资产配置模型

敬请参阅最后一页特别声明 1 目前,机器学习模型在资产配置等其他领域的定价研究相对偏少,传统的资产配置方法也需要新的思路来构建策略。本次研究中,我们将机器学习模型应用到大类资产配置问题上,基于因子投资的思路使用模型给出各资产的打分排序,并最终构建可投资的大类资产月频量化配置策略。 怎样使用机器学习选择大类资产? 我们使用机器学习模型生成每一期各资产的预期收益率数据,便于进行资产的排序与进一步优化。我们选取各资产对应指数或期货的高开低收作为初始数据,基于 TA-Lib 方法批量化生成量价因子数据作为样本的特征,并使用各资产未来 20 日收益率作为基础标签。模型的选取方面,考虑到树模型在小样本上相较于神经网络更不易过拟合的优势,我们主要使用基于 CART 的集成学习方法,包括 GBDT、RF 和 DART,具体实现模型主要为 XGBoost 与 LightGBM。 数据准备及预处理 我们选择沪深 300、恒生指数、纳斯达克 100 指数、国债指数、SHFE 黄金等共 11 种资产作为配置池,覆盖国内股票、国外股票、债券与商品类资产,并基于这些资产的高开低收数据生成共 154 个量价类特征。我们对特征首先进行时序预处理,确保特征在不同资产之间具有可比性;随后进行截面预处理,此处我们试图通过对比找出最适合的预处理方式。对标签同样进行不同预处理方式的对比,以寻找最优方案。模型我们对比使用 GBDT、RF 和 DART 作为提升方法的LightGBM 模型以及使用 GBDT 的 XGBoost 方法。 如何优化模型在大类资产配置上的应用表现? 我们根据不同的特征处理、标签处理和模型三个维度分别进行测试。通过观察基于 lgb_gbdt 和 lgb_dart 模型得到的结果,我们确定特征在截面上做 MinMax 处理的方法优势最为明显;但不同的标签预处理方式在结合 CSMinMax 处理时各有优势。结合不同模型来看,对标签进行截面 Z-Score 处理时普遍能得到最佳的因子多头收益表现。模型上,基于GBDT 和 DART 的 LightGBM 模型在对应的效果最佳。 基于以上方法得到的两个因子具有较高的相关性,但其中使用 DART 的 LightGBM 模型得到的因子 IC 衰减相对更慢,我们认为这对于降低策略的换手率能带来一定帮助,对资产配置策略较为重要。最终我们确定特征处理方式为CSMinMax,标签处理方式为 ret_CSZScore,使用模型 lgb_dart 生成全球大类资产配置因子。 因子IC均值达到9.00%,多头年化收益13.34%,多头Sharpe比率1.105,多头最大回撤8.53%;多空年化收益率15.20%,多空 Sharpe 比率 1.231。时序上看,因子多空组合净值稳定增长,仅部分月份回撤较大。 人工智能全球大类资产配置策略 我们根据最终的合成因子构造资产配置策略,每月初等权配置因子排名前 3 的资产,手续费取千分之三。我们以 11个资产的等权配置策略作为对比基准。策略的年化收益率为 16.91%,夏普比率为 0.99,而同时间段等权配置策略的年化收益率为2.05%,夏普比率为0.24。策略的年化超额收益率为14.74%,信息比率为1.34,超额最大回撤仅为5.97%。 我们同样叠加最优化问题的求解方法,对策略的波动率做进一步约束。优化后,策略的年化收益率在 7.86%,年化超额收益 4.70%,策略的 Sharpe 比率上升到 1.28,年化双边换手率下降到 288.68%。 风险提示 以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。 金融工程专题报告 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 一、怎样使用机器学习选择大类资产?.............................................................. 4 1.1 为何使用因子投资的方法?................................................................ 4 1.2 从数据到模型,如何匹配因子框架?........................................................ 4 1.3 基于 CART 算法与集成学习的树模型......................................................... 5 二、数据准备及预处理............................................................................ 6 2.1 原始数据................................................................................ 6 2.2 特征预处理方法.......................................................................... 9 2.3 标签预处理方法......................................................................... 10 2.4 模型详细设置........................................................................... 10 三、如何优化模型在大类资产配置上的应用表现?................................................... 10 3.1 优化数据处理方式对因子效果的影响....................................................... 10 3.2 优化模型选取对因子结果的影响........................................................... 12 3.3 因子相关性及衰减测试................................................................... 13 3.4 全球大类资产配置因子................................................................... 13 四、人工智能全球大类资产配置策略............................................................... 14 4.1 策略结果............................................................................... 14 4.2 低波动优化策略 ...

立即下载
信息科技
2024-06-17
国金证券
19页
1.41M
收藏
分享

[国金证券]:Beta猎手系列之九:人工智能全球大类资产配置模型,点击即可下载。报告格式为PDF,大小1.41M,页数19页,欢迎下载。

本报告共19页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共19页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表103:公司业绩预测
信息科技
2024-06-17
来源:宝信软件(600845)公司深度报告:“智能制造%2b稀缺算力”双龙头,AI时代再加速
查看原文
图表102:公司费用率预测
信息科技
2024-06-17
来源:宝信软件(600845)公司深度报告:“智能制造%2b稀缺算力”双龙头,AI时代再加速
查看原文
图表101:公司营业收入及拆分预测
信息科技
2024-06-17
来源:宝信软件(600845)公司深度报告:“智能制造%2b稀缺算力”双龙头,AI时代再加速
查看原文
图表97:宝武数智宝地·罗泾园园区展示图 图表98:宝之云厂区毗邻上海市区
信息科技
2024-06-17
来源:宝信软件(600845)公司深度报告:“智能制造%2b稀缺算力”双龙头,AI时代再加速
查看原文
图表96:2023 年云计算安全事故(部分)
信息科技
2024-06-17
来源:宝信软件(600845)公司深度报告:“智能制造%2b稀缺算力”双龙头,AI时代再加速
查看原文
图表95:智算中心建设运营能力要求较高
信息科技
2024-06-17
来源:宝信软件(600845)公司深度报告:“智能制造%2b稀缺算力”双龙头,AI时代再加速
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起