金工深度研究:量化如何追求模糊的正确,有序回归

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 金工 量化如何追求模糊的正确:有序回归 华泰研究 研究员 林晓明 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +(86) 755 8208 0134 研究员 李子钰 SAC No. S0570519110003 SFC No. BRV743 liziyu@htsc.com +(86) 755 2398 7436 研究员 何康,PhD SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +(86) 21 2897 2039 有序回归超额收益(基模型为 nn) 注:ensemble_prediction 为各有序回归预测值集成,wmse 为基线;回测期 2011-01-04 至 2022-09-30,基准为中证 500 指数 资料来源:朝阳永续,Wind,华泰研究 有序回归超额收益(基模型为 gat) 注:ensemble_prediction 为各有序回归预测值集成,wmse 为基线;回测期 2011-01-04 至 2022-09-30,基准为中证 500 指数 资料来源:朝阳永续,Wind,华泰研究 2022 年 10 月 11 日│中国内地 深度研究 人工智能系列之 60:有序回归损失函数应用于选股 本研究介绍有序回归原理,测试该方法在周频中证 500 指增模型中的表现,结果表明有序回归损失函数整体优于传统 mse 损失函数。分类会损失顺序和距离信息;回归可能欠缺实际投资含义,并且对异常值敏感;有序回归将分类和回归特点结合,追求“模糊的正确”。选股测试中,以全连接神经网络或残差图注意力网络为基模型,logistic 有序回归可以提升模型 Rank IC和多空收益;将加权 mse 和有序回归预测结果集成,集成后年化超额收益、信息比率显著提升。 分类和回归的缺陷 分类和回归是两类常见的机器学习任务。选股场景中,既可设计为预测“涨”“跌”的分类问题,也可设计为预测收益率的回归问题。然而这两种任务类型各有缺陷。分类问题将预测目标由连续、稠密的收益率简化为离散、稀疏的类别,损失原始数据中的顺序和距离信息。回归问题的预测可能欠缺实际投资含义,如预测误差小但方向判断错误。另外,回归问题对异常值敏感。回归追求对目标的精确拟合,但金融数据信噪比低,有时“精确的错误”反而不如“模糊的正确”。 有序回归将分类和回归特点结合,追求“模糊的正确” 有序回归对分类损失函数加以改造,将分类和回归的特点结合,使得模型在保留信息同时,兼顾实际投资含义,追求“模糊的正确”。有序回归可基于二分类推导,将 K 分类问题转换为 K-1 个二分类问题,对这 K-1 个二分类损失函数求和,得到 K 分类有序回归损失函数。常用的二分类损失函数如logistic、exponential、hinge 损失都可以改造成有序回归形式。 有序回归损失函数相比基线加权 mse 在 Rank IC 等指标上有提升 在周频中证 500 指增模型中,测试有序回归损失函数超额收益表现,以加权 mse 损失函数为基线。当基模型为全连接神经网络,logistic 有序回归损失函数可以提升模型 Rank IC、多空收益、年化超额收益和信息比率。当基模型为残差图注意力网络,logistic 有序回归损失函数可以提升模型 Rank IC和多空收益,但指增组合表现无显著改善。将 wmse 和有序回归预测结果进行集成,集成模型的年化超额收益、信息比率相比基线显著提升。 参数敏感性测试:损失函数、加权方式、分类数量、模型集成方式 考察损失函数、加权方式、分类数量、模型集成方式对模型表现的影响。Logistic 损失总体优于 exponential 和 hinge 损失;对截面收益高的股票赋予更高权重,样本加权、类别加权和样本-类别加权差异不大;对于全 A 股总市值和流动性前 60%股票池,分类数量为 10 时效果较好;预测值集成方法将子模型的预测值求均值再进行组合优化,效果总体优于子模型组合等权配置季度再平衡的组合集成方法。 风险提示:人工智能挖掘市场规律是对历史的总结,市场规律在未来可能失效。人工智能技术存在过拟合风险。深度学习模型受随机数影响较大,本文未进行随机数敏感性测试。本文测试的选股模型调仓频率较高,假定以 vwap价格成交,忽略其他交易层面因素影响。 -15%-10%-5%0%5%10%15%20%25%-300%-200%-100%0%100%200%300%400%500%2011-01-042012-01-042013-01-042014-01-042015-01-042016-01-042017-01-042018-01-042019-01-042020-01-042021-01-042022-01-04ensemble_prediction超额收益最大回撤(右轴)wmse超额收益最大回撤(右轴)ensemble_prediction累计超额收益wmse累计超额收益-15%-10%-5%0%5%10%15%20%25%-300%-200%-100%0%100%200%300%400%500%2011-01-042012-01-042013-01-042014-01-042015-01-042016-01-042017-01-042018-01-042019-01-042020-01-042021-01-042022-01-04ensemble_prediction超额收益最大回撤(右轴)wmse超额收益最大回撤(右轴)ensemble_prediction累计超额收益wmse累计超额收益 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 导读 .............................................................................................................................................................................. 3 有序回归原理 ................................................................................................................................................................ 5 从二分类逻辑回归谈起 ................................................................................................................................

立即下载
金融
2022-10-20
华泰证券
24页
1.37M
收藏
分享

[华泰证券]:金工深度研究:量化如何追求模糊的正确,有序回归,点击即可下载。报告格式为PDF,大小1.37M,页数24页,欢迎下载。

本报告共24页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共24页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
BA 策略与 alpha 策略净值曲线(起点归一化)
金融
2022-10-20
来源:金工深度研究:固收+基金资产配置能力分析与筛选
查看原文
BA 指标与 Alpha 指标选基效果对比
金融
2022-10-20
来源:金工深度研究:固收+基金资产配置能力分析与筛选
查看原文
BA 指标策略稳健性检验净值曲线(起点归一化)
金融
2022-10-20
来源:金工深度研究:固收+基金资产配置能力分析与筛选
查看原文
BA 指标策略稳健性检验回测结果
金融
2022-10-20
来源:金工深度研究:固收+基金资产配置能力分析与筛选
查看原文
稳健性检验流程
金融
2022-10-20
来源:金工深度研究:固收+基金资产配置能力分析与筛选
查看原文
BA 策略净值曲线(起点归一化)
金融
2022-10-20
来源:金工深度研究:固收+基金资产配置能力分析与筛选
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起