“量价淘金”选股因子系列研究(九):Memory+Map在因子生产加速上的应用,以构建羊群效应因子簇为例
证券研究报告 | 金融工程 请仔细阅读本报告末页声明 gszqdatemark 量化专题报告 “量价淘金”选股因子系列研究(九) Memory Map 在因子生产加速上的应用 ——以构建羊群效应因子簇为例 前言:本文为国盛金工《“量价淘金”选股因子系列研究》的第九篇报告,也是“因子生产加速”相关研究的首次尝试,从数据存储技术、体系化的因子构建框架这两个角度出发,探索如何系统性、快速、批量挖掘 Alpha因子。 Memory Map 数据存储技术:相比于传统的 CSV、Parquet 等存储形式,Memory Map 减少了显式的文件 I/O 操作,将数据直接映射到内存中,可大幅提升访问速度。以读取宽表存储形式下、某一交易日所有股票的分钟收盘价数据为例,Memory Map 的读取耗时不到 800μs,读取速度约为Parquet 的 260 倍、CSV 的 330 倍。 体系化的因子构建框架——羊群效应因子簇:我们将事件研究的想法,融入到选股因子的构建中。提炼因子构建流程中的 3 个关键因素,事件识别、因子定义、数据频率,分别展开详细讨论。在 Memory Map 数据存储技术的助力下,基于经济学逻辑,最终构建了约 50 万个羊群效应因子,并通过进一步筛选,保留其中效果最优且相关性较低的 50 个因子,称之为“羊群效应因子簇”。 羊群效应综合因子:在“羊群效应因子簇”中选取信息比率最高的 10 个因子、等权合成,得到羊群效应综合因子。回测期 2016/01/01-2024/09/30内,在全体 A 股中,该因子的月度 RankIC 均值为 0.116,年化 RankICIR为 4.23;10 分组多空对冲的年化收益为 43.21%,信息比率为 3.79,月度胜率为 84.62%,最大回撤为 6.31%。在剔除了市场常用风格和行业的影响后,纯净因子仍然有效,年化 RankICIR 达到 3.67,全市场 10 分组多空对冲的信息比率为 3.81。 指数增强组合的表现:基于羊群效应综合因子,构建月频调仓的指数增强组合:(1)沪深 300 指数增强组合的超额年化收益为 9.06%,跟踪误差为4.47%,信息比率为 2.03,月度胜率为 73.08%,最大回撤为 4.42%;(2)中证 500 指数增强组合的超额年化收益为 12.20%,跟踪误差为 5.44%,信息比率为 2.24,月度胜率为 72.12%,最大回撤为 4.36%;(3)中证1000 指数增强组合的超额年化收益为 17.78%,跟踪误差为 6.57%,信息比率为 2.71,月度胜率为 82.69%,最大回撤为 6.24%。 风险提示:以上结论均基于历史数据和统计模型的测算,如果未来市场环境发生明显改变,不排除模型失效的可能性。 作者 分析师 沈芷琦 执业证书编号:S0680521120005 邮箱:shenzhiqi@gszq.com 分析师 刘富兵 执业证书编号:S0680518030007 邮箱:liufubing@gszq.com 研究助理 阮俊烨 执业证书编号:S0680124070019 邮箱:ruanjunye@gszq.com 相关研究 1、《“量价淘金”选股因子系列研究(一):如何将隔夜涨跌变为有效的选股因子?——基于对知情交易者信息优势的刻画》2022-04-26 2、《“量价淘金”选股因子系列研究(二):不同交易者结构下的动量与反转》2022-10-24 3、《“量价淘金”选股因子系列研究(三):如何基于 RSI技术指标构建有效的选股因子》2023-03-06 4、《“量价淘金”选股因子系列研究(四):高/低位放量:从事件驱动到选股因子》2023-12-18 5、《“量价淘金”选股因子系列研究(五):基于趋势资金日内交易行为的选股因子》2024-05-28 6、《“量价淘金”选股因子系列研究(六):创新高股票中的 Alpha》2024-06-26 7、《“量价淘金”选股因子系列研究(七):盲目追随趋势资金的极端交易行为分析——羊群效应的识别与因子构建》2024-08-06 8、《“量价淘金”选股因子系列研究(八):逐笔买卖差异中的选股信息——条件成交不平衡因子》2024-10-09 9、《量化分析报告:择时雷达六面图:本期打分无变化》2024-11-16 10、《量化周报:市场短期有可能进入震荡整固期》2024-11-17 2024 11 20年 月 日 gszgszgszqdqdqdatemark P.2 请仔细阅读本报告末页声明 内容目录 一、前言 ........................................................................................................................................................... 4 二、Memory Map 数据存储技术......................................................................................................................... 5 2.1 概念简介 .............................................................................................................................................. 5 2.2 数据存储实例 ....................................................................................................................................... 5 2.3 数据读取与因子计算速度对比 .............................................................................................................. 7 三、羊群效应因子簇的构建 ............................................................................................................................... 8 3.1 因子构建的体系化思路 ......................................................................................................................... 8 3.2 事件识别:趋势资金是否行动
[国盛证券]:“量价淘金”选股因子系列研究(九):Memory+Map在因子生产加速上的应用,以构建羊群效应因子簇为例,点击即可下载。报告格式为PDF,大小1.82M,页数25页,欢迎下载。
