机器学习研究系列之五:机器学习策略的可解释性分析
请仔细阅读在本报告尾部的重要法律声明 1 [Table_Title] 机器学习策略的可解释性分析 [Table_Title2] 机器学习研究系列之五 [Table_Summary] 投资要点: ► 机器学习类量化策略效果较好但无法直观理解 在前期的报告中,我们构建了利用卷积神经网络进行自动化特征抽取并通过全连接层输出分类结果的非线性择时模型,并在指数择时的场景下取得了良好的结果。但深度模型的预测过程往往被人看作是一个黑箱(Blackbox),本文将通过构建机器学习的可解释性框架从定量的角度解释机器学习策略的内在逻辑。 ► 引入可解释性框架对机器学习策略进行可解释性分析,深入理解策略收益来源 机器学习模型的可解释性一直是学术界研究的重要方向,但模型的效果和可解释性却难以权衡。例如,深度学习模型往往效果最为突出,但无法直观理解。本文介绍了当前已有的解释性框架及原理,并尝试使用 SHAP 框架对择时策略进行可解释性分析。 ► SHAP 框架适用范围较广,能够解释特征输入如何影响预测值 SHAP 框架的核心是计算特征的 Shapley 值,该值衡量了特征对于预测结果的贡献。通过特征的 Shapley 值进行分析可以判断在一次或多次预测过程中输入特征的重要程度,从而得到因子对于资产收益率的非线性相关性关系,相比于因子的 IC 值,因子的 Shapley 值信息含量更高。 ► 风险提示 模型基于对历史数据统计,仅作为投资参考。 评级及分析师信息 [Table_Author] 证券分析师:王祥宇 SAC NO:S1120520080004 证券分析师:杨国平 SAC NO:S1120520070002 研究助理:周游 邮箱:zhouyou2@hx168.com.cn 证券研究报告|量化研究报告 仅供机构投资者使用 [Table_Date] 2022 年 12 月 20 日 171018 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 2 正文目录 1. 机器学习模型的可解释性............................................................................................................................... 3 1.1. 可解释性的定义 ........................................................................... 3 1.2. 可解释性的重要性 ......................................................................... 3 1.3. 统计学习模型解释性较好 ................................................................... 4 1.4. 机器学习模型的解释性框架 ................................................................. 5 2. 卷积神经网络择时策略的可解释性分析......................................................................................................... 8 2.1. 择时策略设计思路 ......................................................................... 8 2.2. 择时策略的构建和评估 .................................................................... 10 2.3. 基于 SHAP 框架的策略解释性分析 ........................................................... 15 3. 总结...............................................................................................................................................................17 4. 风险提示 .......................................................................................................................................................18 图表目录 图 1:可解释性方法分类维度.....................................................................................................................................................................6 图 2:一个使用 LIME 方法进行解释的例子 ............................................................................................................................................7 图 3:第 5 次买入交易的特征重要性排名 ........................................................................................................................................... 13 图 4:第 10 次买入交易的特征重要性排名 ......................................................................................................................................... 13 图 5:第 15 次买入交易的特征重要性排名 ......................................................................................................................................... 13 图 6:第 20 次买入交易的特征重要性排名 ...................
[华西证券]:机器学习研究系列之五:机器学习策略的可解释性分析,点击即可下载。报告格式为PDF,大小1.89M,页数20页,欢迎下载。



