机器学习与因子(二):Transformer 特征工程算法测评

证券研究报告 | 金融工程深度 http://www.stocke.com.cn 1/22 请务必阅读正文之后的免责条款部分 金融工程深度 报告日期:2023 年 08 月 12 日 机器学习与因子(二):Transformer 特征工程算法测评 核心观点 Transformer 作为 ChatGPT 的底层模型,展示出了其在自然语言任务中的强大性能。股票投资场景和自然语言任务有内在相似之处,金融时间序列可以被看作文字序列,且 Transformer 在处理长期记忆和变长序列任务中有优势。因此,本文尝试在股票投资场景测试 Transformer 算法的特征工程能力。 ❑ 基于 Transformer 构建特征工程模型 本文以带时间步长的多维因子作为输入数据,以股票的次月回报作为标签,逐步测试了各个超参数对 Transformer 模型的影响,并最终确定了月频调仓场景下应用于股票特征工程的模型架构。 ❑ Transformer 算法能有效对特征加总 经训练的 Transformer 模型在样本外能有效对股票特征进行加总并筛选股票。经过中证 1000、中证 500、沪深 300 和全市场股票池的检验,模型能有效筛选出股票组合,从而对基准指数或空头组合形成稳定超额。经测试,基于 Transformer的特征工程模型 IC 为 0.047,IR 为 0.69。 ❑ Transformer 对比其它算法无明显优势 在相同的场景设定下,本文对比了 Transformer 和《机器学习与因子(一):特征工程算法测评》中测试的其它十种机器学习模型,Transformer 并未体现出明显优势。可能的原因是月频样本的数量难以满足大参数模型训练要求。 ❑ 风险提示 模型测算风险:超参数设定对模型结果有较大影响;收益指标等指标均限于一定测试时间和测试样本得到,收益指标不代表未来。 模型失效风险:机器学习模型基于历史数据进行测算,不能直接代表未来,仅供参考。 分析师:陈奥林 执业证书号:S1230523040002 chenaolin@stocke.com.cn 研究助理:陆达 luda@stocke.com.cn 相关报告 1 《机器学习与因子(一):特征工程算法测评》 2023.06.14 金融工程深度 http://www.stocke.com.cn 2/22 请务必阅读正文之后的免责条款部分 正文目录 1 Transformer 算法 .......................................................................................................................................... 4 1.1 算法简介 ............................................................................................................................................................................. 4 1.2 Transformer 工作流程 ......................................................................................................................................................... 4 2 Transformer 特征工程 .................................................................................................................................. 7 2.1 数据采集与处理 ................................................................................................................................................................. 7 2.2 输入因子构建 ..................................................................................................................................................................... 7 2.3 模型训练 ............................................................................................................................................................................. 8 2.3.1 训练数据 .................................................................................................................................................................. 8 2.3.2 样本划分 .................................................................................................................................................................. 8 2.3.3 超参数选取 .............................................................................................................................................................. 9 2.3.4 拟合优度 .................................................................................................................................................................. 9 3 实证检验 .........................................

立即下载
金融
2023-08-28
浙商证券
22页
1.43M
收藏
分享

[浙商证券]:机器学习与因子(二):Transformer 特征工程算法测评,点击即可下载。报告格式为PDF,大小1.43M,页数22页,欢迎下载。

本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
锂电行业研报情绪选股结果回测
金融
2023-08-28
来源:机器学习系列_数据治理专题(六):集聚投资有效性,构建DATALET数据资产
查看原文
2022 年 1 月至 2023 年 6 月期间锂电行业研报情绪选股结果
金融
2023-08-28
来源:机器学习系列_数据治理专题(六):集聚投资有效性,构建DATALET数据资产
查看原文
基于研报情绪构建的行业择时策略超额收益情况
金融
2023-08-28
来源:机器学习系列_数据治理专题(六):集聚投资有效性,构建DATALET数据资产
查看原文
政策情绪策略净值曲线
金融
2023-08-28
来源:机器学习系列_数据治理专题(六):集聚投资有效性,构建DATALET数据资产
查看原文
政策情绪参数设置和各参数下策略收益情况
金融
2023-08-28
来源:机器学习系列_数据治理专题(六):集聚投资有效性,构建DATALET数据资产
查看原文
2022 年 7 月以来每月行业政策情绪指标(已剔除综合、综合金融)
金融
2023-08-28
来源:机器学习系列_数据治理专题(六):集聚投资有效性,构建DATALET数据资产
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起