Alpha掘金系列之十九:基于Mamba2模型的端到端选股框架

敬请参阅最后一页特别声明 1 从 SSM, Mamba 到 Mamba2 模型 本文创新性地将 Mamba-2 模型加入整体模型架构,该模型通过 SSD 把 SSM 计算重写为矩阵乘+少量结构化算子,既继承 Mamba 的“选择性状态压缩”,又在系统层面获得与 GPU 硬件高度匹配的输入输出优势,形成“表达力-效率-可扩展性”的三重平衡。对需要超长上下文、吞吐敏感且部署成本受限的应用场景(语音/时间序列/金融高频等),Mamba-2 提供了优于纯注意力与传统 RNN/SSM 的解法与性价比。 Mamba2 模型与 GRU 选股效果比较 我们分别选取了 10 分钟、30 分钟、60 分钟、一日四种不同频率的基础量价数据,在相同数据与回测框架下,对比Mamba2 与经典 GRU 模型的选股效果。结果表明,Mamba2 模型只有在日频数据上整体表现明显优于 GRU 模型,60 分钟频上与 GRU 模型不分伯仲,30 分钟频上能够带来沪深 300 的优化。但相关性测算显示 GRU 与 Mamba2 在不同频率的“截面信号”相关性约 70%–80%,这意味着二者并非冗余:通过模型-频率的合成(如日频+60 分/30 分、GRU+Mamba2)有望带来增量信息与风格分散。 模型合成与宽基指增策略 在构建模型前,我们构造了三类个股不变的市场信息(三大宽基指数点位、当前交易日的时间信息、基于 Barra 因子构建的市场风格指数)作为附加输入。结果显示:三大宽基指数信息的提升最为显著,IC、多头多空收益与回撤指标均明显改善;时间信息与 Barra 风格信息在 GRU 上并未带来稳定增益。 根据以上所有探讨,我们构建了“GRU(4 频)+Mamba2(3 频)+GJQuant 因子→LGBM”的二层合成架构,并在 GRU4 频输入基础上引入三大宽基指数点位信息。从合成结果看,加入 Mamba2 后 IC、多头超额等维度表现较之 GRU 基线提升明显,再叠加 LGBM 进一步提升;当三者联合并引入 GJQ 因子库后,各个维度表现进一步提升至最佳。更关键的是,多空年化收益率与夏普比率在合成后持续抬升,而多空波动率并未同步放大,说明合成带来了真实 Alpha 增量而非来源于杠杆放大。 据此搭建的三大宽基的指数增强策略均取得显著超额,沪深 300、中证 500、中证 1000 指增策略的年化超额分别达到9.99%、12.20%和 20.65%,信息比率分别为 1.88、2.24 和 3.31;最大回撤方面,三者的主动层回撤均显著小于指数本身。总体来说,合成架构表现优异。 风险提示 1、 以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。 2、 策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。 金融工程专题报告 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 一、从 SSM, Mamba 到 Mamba2 模型.................................................................. 4 1.1 结构化状态空间模型(SSM):从连续系统到可并行计算........................................ 4 1.2 Mamba:选择性 SSM 与 RNN/Transformer 之间的效率-效果折衷.................................. 4 1.3 Mamba-2:以 SSD(半可分离矩阵)实现张量并行友好的 SSM.................................... 5 二、Mamba2 模型与 GRU 选股效果比较 ............................................................... 6 三、模型合成与宽基指增策略..................................................................... 11 3.1 引入 3 种市场整体信息................................................................... 11 3.2 收益率长尾分布与损失函数的选择......................................................... 13 3.3 模型合成框架:频率×模型×传统因子三线并进............................................. 14 3.4 宽基指数增强策略....................................................................... 16 总结........................................................................................... 17 风险提示....................................................................................... 18 图表目录 图表 1: 结构化状态空间模型(SSM) .............................................................. 4 图表 2: 结构化状态空间模型图解 ................................................................. 4 图表 3: 离散化的状态空间模型 ................................................................... 4 图表 4: 卷积化的状态空间模型 ................................................................... 4 图表 5: Mamba 模型与 Transformer 和 GRU 的区别.................................................... 5 图表 6: Mamba2 矩阵分解方法..................................................................... 5 图表 7: SSD 与 Attention 和 SSM 的比较............................................................ 6 图表 8: Mamba2 相对 Mamba1 结构的改进............................................................ 6

立即下载
综合
2025-12-03
国金证券
19页
1.65M
收藏
分享

[国金证券]:Alpha掘金系列之十九:基于Mamba2模型的端到端选股框架,点击即可下载。报告格式为PDF,大小1.65M,页数19页,欢迎下载。

本报告共19页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共19页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
上月金股组合表现
综合
2025-12-03
来源:十二月金股汇
查看原文
十二月金股汇总
综合
2025-12-03
来源:十二月金股汇
查看原文
符合转债发行条件的公司家数
综合
2025-12-03
来源:2025年研究成果综述暨2026年转债年度策略:牛市中继,“绩”中寻机
查看原文
分行业统计的待发转债规模(亿元)及数量(只)
综合
2025-12-03
来源:2025年研究成果综述暨2026年转债年度策略:牛市中继,“绩”中寻机
查看原文
2025年提议下修、正式下修及不下修转债事件分月统计
综合
2025-12-03
来源:2025年研究成果综述暨2026年转债年度策略:牛市中继,“绩”中寻机
查看原文
2025年赎回及不赎回转债事件分月统计
综合
2025-12-03
来源:2025年研究成果综述暨2026年转债年度策略:牛市中继,“绩”中寻机
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起