【专题报告】基于价量数据的排序学习选股模型
证 券 研 究 报 告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载 金融工程 专题报告 2023 年 09 月 28 日 【专题报告】 基于价量数据的排序学习选股模型 排序学习的定义 排序学习(Learning to Rank,LTR)又名“机器排序学习”(Machine-learned Ranking)是一种监督学习方法,此机器学习算法通过在数据集上对大量特征进行训练,从而学习生成排序模型,以用于解决实际中的排序问题。排序学习在文档检索、过滤和推荐系统等领域,已得到广泛应用。 LTR 算法演变 本文逐步介绍排序学习具体的算法演变,其中包括了,基于配对文档相对排序的概率损失函数,用数据对来训练模型的 pairwise 排序学习方法 RankNet、对RankNet 的配对思想进行了扩展,将 RankNet 中损失函数相对得分函数的梯度定义为 lambda,与整体排序的评分标准(如 NDCG)进行结合的 LambdaRank、以及我们模型中所用到的在 LambdaRank 的基础上将 Mart 与现有模型相结合的 LambdaMart 算法。 模型设计 在构建股票池的时候,选择了沪深 300、中证 500、中证 1000 的历史成份股分别作为 A 股市场大盘股、中盘股、小盘股的代表构建了 1800 只股票的备选股票池,取数时间范围为 2014 年 11 月至 2023 年 8 月底。选股策略选取了价量数据作为模型特征的主要组成部分,其中包括了每日个股上大单、中单、小单的流入流出数据,并在此基础上添加了一致预期数据。在进行数据处理之后,我们对以上数据使用了不同的算子进行特征工程。 LGBMRanker 选股轮动模型回测结果 本文通过使用 LGBMRanker 对沪深 300、中证 500、中证 1000 的成份股进行排序学习,构建出基于价量数据的选股模型,经回测该策略从 2015 年 11 月至2023 年 8 月底的累计绝对收益率为 167.31%,相较于等权基准,累计超额收益率为 160.16%,年化收益率为 13.28%,超额年化为 12.40%,夏普比率为 0.48,最大回撤为 34.58%。从回测结果来看,策略相较于等权基准的年胜率为88.89%,月胜率为 65.96%,相较于沪深 300 的年胜率为 77.78%,月胜率为58.51%,相较于中证 500 的年胜率为 100%,月胜率为 67.02%,相较于中证1000 的年胜率为 100%,月胜率为 76.60%。策略 2023 年年初至 8 月底的绝对收益率为 18.10%,相较于等权基准,超额收益率为 13.14%,表现出色。 风险提示: 本报告中所有统计结果和模型方法均基于历史数据,不代表未来趋势。 证券分析师:杨宸祎 邮箱:yangchenyi@hcyjs.com 执业编号:S0360523080003 相关研究报告 《量化选股系列——机构情绪与个人情绪》 2023-09-05 《技术指标研究之一:重新认识技术指标》 2023-08-21 《形态学研究之八:如何利用形态信号进行行业择时》 2023-08-07 《K 线形态研究之七:停顿线》 2023-07-31 《K 线形态研究之六:乌云压顶线》 2023-07-31 华创证券研究所 专题报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 2 投资主题 报告亮点 本篇报告作为排序学习系列研究的第二篇报告,首先简单回顾了排序学习的理论基础与算法逻辑,然后深入地介绍了排序学习几种算法的演变并做了简单的推导,最后使用 LGBMRanker 在目标股票池内上构建出基于排序学习的选股模型,表现出色。 投资逻辑 排序学习将个股的价量特征作为参数输入,将其转化为当期对个股未来走势的相对优劣排序。根据历史数据回测,通过持仓排名较前的个股,可以取得一定的相较于等权基准的超额收益。 oPvMnPoPmPtOtPrRwOyRqO6M8QaQoMnNnPoNlOmMyReRmOvN8OqRsONZtOmMxNtQnQ 专题报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 3 目 录 一、什么是排序学习? ............................................................................................................. 5 (一)排序学习的背景 ..................................................................................................... 5 (二)排序学习的特殊之处 ............................................................................................. 5 二、排序学习算法演变 ............................................................................................................. 5 (一)RankNet 介绍 .......................................................................................................... 5 1、概率损失函数 ........................................................................................................... 6 (二)LambdaRank 介绍 ................................................................................................... 6 1、对 RankNet 算法的加速 ........................................................................................... 6 2、梯度函数λ的选取 ..................................................................................................... 8 (三)LambdaMart 介绍 ...........................................................................
[华创证券]:【专题报告】基于价量数据的排序学习选股模型,点击即可下载。报告格式为PDF,大小1.59M,页数23页,欢迎下载。
