机器学习与因子(一):特征工程算法测评
证券研究报告 | 金融工程深度 http://www.stocke.com.cn 1/25 请务必阅读正文之后的免责条款部分 金融工程深度 报告日期:2023 年 06 月 15 日 机器学习与因子(一):特征工程算法测评 核心观点 本文使用一系列机器学习模型对相同的输入因子进行特征工程,对比不同模型选股组合的投资表现,并定量分析因子对个股定价的影响,得出如下结论: 首先,机器学习能够提高投资组合的绩效,集成学习树模型效果最佳。其次,机器学习模型体现出了对 A 股市场的一定动态适应能力。最后,交易类因子是决定个股短期定价最重要的因素之一。成交稳定,价格低波动的股票短期内表现出较高回报。 ❑ 机器学习模型能提升组合绩效,树模型表现最佳 以万得全 A 指数为基准,各机器学习模型在样本外都可获得超额回报。分别在固定时间窗口训练模式和滚动时间窗口训练模式下,对比 3 类共 10 种机器学习模型在预测股票短期收益率方面的效果。结果显示,梯度提升树模型 LightGBM和 XGBoost 在两种训练模式下表现最好。 ❑ 机器学习模型有动态适应能力 测评各模型在滚动时间窗口模式下,预测股票短期回报的表现。结果显示,绝大多数模型在滚动窗口模式下,股票回报预测的准确性良好。这表明机器学习模型具有一定的动态环境适应能力。 ❑ 交易类因子是影响个股短期定价最关键的因素 本文检验了主流多因子和经研究检验的补充因子的重要性。结果显示,各模型在不同年份,都认为交易类因子的重要性最高,交易类因子是影响股票短期定价的关键因素,重要程度占比为 75%。相比而言,基本面因子对股票短期回报的解释力和预测力较弱。 ❑ 流动性稳定、低波动性的股票短期收益占优 短期内回报较高的股票通常具备以下几个交易特征:成交额波动较小,价格对交易正弹性,短期内未发生过大幅度筹码交换且近期未发生过价格的剧烈波动。 ❑ 风险提示 模型测算风险:超参数设定对模型结果有较大影响;收益指标等指标均限于一定测试时间和测试样本得到,收益指标不代表未来。 模型失效风险:机器学习模型基于历史数据进行测算,不能直接代表未来,仅供参考。 分析师:陈奥林 执业证书号:S1230523040002 chenaolin@stocke.com.cn 研究助理:陆达 luda@stocke.com.cn 相关报告 金融工程深度 http://www.stocke.com.cn 2/25 请务必阅读正文之后的免责条款部分 正文目录 1 引言 ............................................................................................................................................................... 4 2 数据采集与处理 ........................................................................................................................................... 4 3 特征工程算法对比 ....................................................................................................................................... 5 3.1 因子构建 ............................................................................................................................................................................. 5 3.2 模型选择 ............................................................................................................................................................................. 7 3.3 模型训练 ............................................................................................................................................................................. 7 3.3.1 固定时间窗口 .......................................................................................................................................................... 7 3.3.2 预训练+滚动时间窗口调优 .................................................................................................................................... 7 3.4 组合回测与优化 ................................................................................................................................................................. 8 3.4.1 固定时间窗口组合回测 .......................................................................................................................................... 8 3.4.2 滚动时间窗口组合回测 ........................................................................................................................................ 10 3.4.3 固定窗口与滚动窗口结果对比 ............................................................................
[浙商证券]:机器学习与因子(一):特征工程算法测评,点击即可下载。报告格式为PDF,大小4.18M,页数25页,欢迎下载。
