金工深度研究: 高频因子计算的GPU加速

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 金工 高频因子计算的 GPU 加速 华泰研究 研究员 林晓明 SAC No. S0570516010001 SFC No. BPY421 linxiaoming@htsc.com +(86) 755 8208 0134 研究员 何康,PhD SAC No. S0570520080004 SFC No. BRB318 hekang@htsc.com +(86) 21 2897 2039 2023 年 10 月 16 日│中国内地 深度研究 人工智能系列之 70:使用 NVIDIA RAPIDS 对高频因子计算进行 GPU 加速 本文使用 NVIDIA RAPIDS 对高频因子计算进行 GPU 加速。量化因子计算场景下,RAPIDS 的直接助力是用 CuPy、cuDF 的 GPU 运算替代 NumPy、Pandas 的 CPU 运算。在 RTX 3090 和 i9-10980XE 测试环境下计算分钟线因子,CuPy 和 cuDF 替换库函数的提速效果约为 6 倍,若同时将 for 循环替换为矩阵运算,最终提速超 100 倍。预计 RTX 4090 和 A800 提速更显著。最大化 ICIR 法合成高频因子,并与华泰金工神经网络多频率因子静态加权,构建中证 1000 指数增强组合,以 2016 年末至 2023 年 9 月为回测区间,信息比率从 3.70 提升至 3.87,超额收益 Calmar 比率从 2.41 提升至 3.96。 使用 CuPy/cuDF 替代 NumPy/Pandas,RTX 3090 实现约 6 倍性能提升 RAPIDS 的重要特性之一是将基于 CUDA 底层代码的优化以 Python 语言的形式体现。常用 API 如 CuPy(对标 NumPy)、cuDF(对标 Pandas)、cuML(对标 scikit-learn)等。由于 API 语法几乎相同,仅需轻量级代码修改,即可实现 CPU 运算到 GPU 运算的迁移。针对全部因子使用 CuPy 和 cuDF替换原函数,部分因子使用矩阵运算替换 for 循环。结果表明:不引入矩阵运算时,单独替换库函数反而增加时间开销。若两步同时进行,替换库函数带来的性能提升约 6 倍(RTX 3090),矩阵运算带来的性能提升约 18 倍。GPU 性能同型号和数据量相关,单次运算数据量越大,加速效果越显著。 分钟线选股因子:价格全局特征类、价格局部特征类 本文测试 5 类共计 50 个分钟线选股因子。以下展示测试效果较好的因子及投资逻辑:(1)价格全局特征类:return_intraday、tp_diff、return_improved的本质是不同形式的日内反转因子,return_var 的本质是日内低波动因子。(2)价格局部特征类:return_last_30min 和 return_skewness_last_30min 的本质是尾盘反转因子,return_upward_var 和 return_downward_var 的本质是日内低波动因子的精细化刻画。 分钟线选股因子:成交量/额类、成交关联价格类、价量相关性类 (3)成交量/额类:volume_open_30min_ratio 给予开盘成交不活跃的股票风险溢价,市场情绪一般在开盘释放,该因子或反映理性交易者占比。amount_out_order_avg_ratio 给予单笔流出金额较大的股票风险溢价,或对应 快 速 下 跌 后 的 反 转 或 者 主 力 的 操 纵 行 为 。 (4) 成 交 关 联 价 格 类 :cum_return_top30_order 的本质是反转因子的精细化刻画,大单推动的涨幅更具信息量。(5)价量相关性类:VP、VP_top33_volume、VR_1min_lag的本质都是捕捉量价背离,即缩量上涨或放量下跌。 最大化 ICIR 法合成分钟线因子,与神经网络因子结合构建选股策略 进一步围绕分钟线因子构建选股策略。采用最大化 ICIR 法对前述 50 个因子进行合成,以未来 5 日收益为预测目标,合成因子 RankICIR(未年化)1.50,对冲组合夏普比率 3.59,Top 层信息比率 3.81。该合成因子和神经网络多频率因子相关系数为 0.25,两者截面标准化后静态融合,构建指数增强策略。结果显示,结合分钟线合成因子后,策略各项指标均有提升,尤其体现在回撤控制。中证 500 增强信息比率从 2.78 提升至 3.01,超额收益 Calmar比率从 1.37 提升至 2.07,中证 1000 增强信息比率从 3.70 提升至 3.87,超额收益 Calmar 比率从 2.41 提升至 3.96。 风险提示:人工智能挖掘市场规律是对历史的总结,市场规律在未来可能失效。人工智能技术存在过拟合风险。深度学习模型受随机数影响较大。本文测试的选股模型调仓频率较高,假定以 vwap 价格成交,忽略其他交易层面因素影响。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 金工研究 正文目录 导言 .............................................................................................................................................................................. 4 NVIDIA RAPIDS 实践 ................................................................................................................................................... 5 RAPIDS 安装 ........................................................................................................................................................ 5 操作系统和 WSL 安装 ................................................................................................................................... 5 WSL Conda 和 RAPIDS 安装 ........................................................................................................

立即下载
金融
2023-10-27
华泰证券
29页
1.56M
收藏
分享

[华泰证券]:金工深度研究: 高频因子计算的GPU加速,点击即可下载。报告格式为PDF,大小1.56M,页数29页,欢迎下载。

本报告共29页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共29页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
基于国证 2000 成份股,不同投资组合的绩效指标
金融
2023-10-27
来源:金工定期报告:新价量相关性RPV因子绩效月报
查看原文
基于中证 1000 成份股,不同投资组合的绩效指标
金融
2023-10-27
来源:金工定期报告:新价量相关性RPV因子绩效月报
查看原文
基于中证 500 成份股,不同投资组合的绩效指标
金融
2023-10-27
来源:金工定期报告:新价量相关性RPV因子绩效月报
查看原文
基于沪深 300 成份股,不同投资组合的绩效指标
金融
2023-10-27
来源:金工定期报告:新价量相关性RPV因子绩效月报
查看原文
Ret20、RPV、SRV 因子在沪深 300、中证 500、中证 1000、国证 2000 成份股中的多空对冲绩效指标
金融
2023-10-27
来源:金工定期报告:新价量相关性RPV因子绩效月报
查看原文
RPV、SRV 因子的多空收益分解
金融
2023-10-27
来源:金工定期报告:新价量相关性RPV因子绩效月报
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起