机器学习系列之三:基于Logsig_RNN的高频数据低频化选股因子

请务必阅读正文后的声明及说明 [Table_Info1] 证券研究报告 [Table_Date] 发布时间:2023-09-07 [Table_Invest] [Table_Report] 相关报告 《上月 Beta、红利、波动率因子表现相对较优》 --20230905 《平安国证 2000ETF 投资价值分析》 --20230811 《上月价值、波动率、红利因子表现较优》 --20230802 《2023 年二季度公募主动权益基金持仓解析》 --20230726 《上月价值、质量、红利因子表现相对较优》 --20230704 [Table_Author] 证券分析师:王琦 执业证书编号:S0550521100001 021-61002390 wangqi_5636@nesc.cn 研究助理:贾英 执业证书编号:S0550122060006 13666061675 jiaying@nesc.cn [Table_Title] 证券研究报告 /金融工程研究报告 基于 Logsig-RNN 的高频数据低频化选股因子 ---机器学习系列之三 报告摘要: [Table_Summary] 本报告主要介绍了适用于高频数据的 Logsig-RNN 模型,它在很大程度上缓解了传统的 RNN 模型在处理高频序列时遇到的序列过长或采样点过密等问题。Logsig-RNN 将高密度采样的多维数据流分段转化为特征集,再输入到 RNN 中进行输出,模型架构简单高效,能够有效处理高频数据低频化问题。之后利用处理后的高频量价数据与 Logsig-RNN 结合构造周度的深度学习因子 LogsigRNN_week,因子表现优异,与传统因子相关性较低,能够为策略提供有效的增量信息。 报告主要分为以下三个部分: Signature 与 log-signature 在路径的特征提取中有着重要的作用。两者均作为路径或数据流的自然特征集,且均具有唯一性,这使得两者含有路径中绝大部分信息。Signature 的重要性质使其可以用高阶项的线性组合来表示一些复杂的关系,且通过线性模型便可以在一定意义上估计基于路径的连续函数。在信息表示上,log-signature 含有与 signature 同样的信息但更为简洁,即在相同截断阶数下维数更低。两者均可处理序列长度不一致的情形,并且经验上,log-signature 对缺失数据更加稳健。相比于 signature,log-signature 并不具有普适性,这使其必须搭配非线性模型才能实现较好的效果。另外在 log-signature 各项的含义上,一阶项表示各分量上的增量,二阶项表示曲线与连线围成的符号面积,高阶项表示更高阶的符号面积,精细地描述路径的形状,刻画数据流的本质特征。 高频量价数据流的 signature 具有选股效果。为详细了解 signature 的作用和其中所蕴含的信息,报告中对高频量价数据流进行处理、变换以及分类,再逐步计算每一类数据流的 signature,最后用 Lasso 去估计signature 与未来收益率的关系。从周度测试结果来看,基于价格信息的因子表现较好。将基于各类信息的因子进行合成,最终得到的 Sig_week因子表现良好(Rank IC:0.0515,ICIR:0.7762)。 Logsig-RNN 在高频数据低频化领域大有可为,构造的深度学习因子LogsigRNN_week 表现优异。Logsig-RNN 包含一个分段特征提取部分和一个 RNN 部分,前者计算每个子区间数据流的 log-signature 特征,然后将特征序列输入到后者中。Logsig-RNN 相比于 RNN 更适用于高频数据,它可以有效地处理数据流并且显著地降低时间维度,而 RNN 只能通过下采样的方式进行处理,可能会导致模型的精度下降。基于处理后的高频量价数据流与 Logsig-RNN 构造的深度学习因子 LogsigRNN_week 表现优异(Rank IC:0.0672,ICIR:0.9333);在将补充因子进行合成后得到的 LogsigRNN_sig_week 因子表现进一步提升(Rank IC:0.0716,ICIR:1.0628)。因子与风格因子、与常见高频因子的相关性较低且更契合小市值的股票池。基于量价因子与深度学习因子的国证 2000 增强组合超额年化收益 14.67%,年化跟踪误差 4.78%。 风险提示:以上分析基于模型结果和历史测算,存在模型失效风险。 请务必阅读正文后的声明及说明 2 / 22 [Table_PageTop] 金融工程研究 目 录 1. 引言 ....................................................................................................................... 4 2. Signature 与 Log-signature 介绍 ....................................................................... 4 2.1. Signature 定义及性质 ............................................................................................................... 4 2.1.1. 路径的 signature ............................................................................................................................................ 4 2.1.2. 基本性质 ....................................................................................................................................................... 5 2.1.3. 各项的含义解释 ........................................................................................................................................... 6 2.1.4. 计算方法 ..........................................................................................................................

立即下载
金融
2023-09-18
东北证券
22页
2.09M
收藏
分享

[东北证券]:机器学习系列之三:基于Logsig_RNN的高频数据低频化选股因子,点击即可下载。报告格式为PDF,大小2.09M,页数22页,欢迎下载。

本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图125.不同价格转债成交量变动趋势(张) 图126.每日全场可转债最小成交量(张)
金融
2023-09-18
来源:固收专题报告:历史上转债新券上市后的交易特征
查看原文
图123.转债上市三周内每日成交量散点图(万张) 图124.转债上市三周内每日成交量方差(单位:十亿)
金融
2023-09-18
来源:固收专题报告:历史上转债新券上市后的交易特征
查看原文
图119.转债上市三周内每天的成交量均值(张) 图120.转债上市三周内成交量最高点和最低点位置
金融
2023-09-18
来源:固收专题报告:历史上转债新券上市后的交易特征
查看原文
表18.2023 年上市的可转债的按照发行量进行的转股溢价率统计(%)
金融
2023-09-18
来源:固收专题报告:历史上转债新券上市后的交易特征
查看原文
图117.转债上市三周内每日转股溢价率散点图(%) 图118.转债上市三周内每日转股溢价率方差
金融
2023-09-18
来源:固收专题报告:历史上转债新券上市后的交易特征
查看原文
表17.2023 年上市可转债按照不同转股溢价率区间进行的统计 上市首日转股溢价率 上市首日转股溢价率均值 上市一周转股溢价率均值 上市两周转股溢价率均值 上市三周转股溢价率均值
金融
2023-09-18
来源:固收专题报告:历史上转债新券上市后的交易特征
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起