【专题报告】基于价量数据的排序学习选股模型

证 券 研 究 报 告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载 金融工程 专题报告 2023 年 09 月 28 日 【专题报告】 基于价量数据的排序学习选股模型  排序学习的定义 排序学习(Learning to Rank,LTR)又名“机器排序学习”(Machine-learned Ranking)是一种监督学习方法,此机器学习算法通过在数据集上对大量特征进行训练,从而学习生成排序模型,以用于解决实际中的排序问题。排序学习在文档检索、过滤和推荐系统等领域,已得到广泛应用。  LTR 算法演变 本文逐步介绍排序学习具体的算法演变,其中包括了,基于配对文档相对排序的概率损失函数,用数据对来训练模型的 pairwise 排序学习方法 RankNet、对RankNet 的配对思想进行了扩展,将 RankNet 中损失函数相对得分函数的梯度定义为 lambda,与整体排序的评分标准(如 NDCG)进行结合的 LambdaRank、以及我们模型中所用到的在 LambdaRank 的基础上将 Mart 与现有模型相结合的 LambdaMart 算法。  模型设计 在构建股票池的时候,选择了沪深 300、中证 500、中证 1000 的历史成份股分别作为 A 股市场大盘股、中盘股、小盘股的代表构建了 1800 只股票的备选股票池,取数时间范围为 2014 年 11 月至 2023 年 8 月底。选股策略选取了价量数据作为模型特征的主要组成部分,其中包括了每日个股上大单、中单、小单的流入流出数据,并在此基础上添加了一致预期数据。在进行数据处理之后,我们对以上数据使用了不同的算子进行特征工程。  LGBMRanker 选股轮动模型回测结果 本文通过使用 LGBMRanker 对沪深 300、中证 500、中证 1000 的成份股进行排序学习,构建出基于价量数据的选股模型,经回测该策略从 2015 年 11 月至2023 年 8 月底的累计绝对收益率为 167.31%,相较于等权基准,累计超额收益率为 160.16%,年化收益率为 13.28%,超额年化为 12.40%,夏普比率为 0.48,最大回撤为 34.58%。从回测结果来看,策略相较于等权基准的年胜率为88.89%,月胜率为 65.96%,相较于沪深 300 的年胜率为 77.78%,月胜率为58.51%,相较于中证 500 的年胜率为 100%,月胜率为 67.02%,相较于中证1000 的年胜率为 100%,月胜率为 76.60%。策略 2023 年年初至 8 月底的绝对收益率为 18.10%,相较于等权基准,超额收益率为 13.14%,表现出色。  风险提示: 本报告中所有统计结果和模型方法均基于历史数据,不代表未来趋势。  证券分析师:杨宸祎 邮箱:yangchenyi@hcyjs.com 执业编号:S0360523080003 相关研究报告 《量化选股系列——机构情绪与个人情绪》 2023-09-05 《技术指标研究之一:重新认识技术指标》 2023-08-21 《形态学研究之八:如何利用形态信号进行行业择时》 2023-08-07 《K 线形态研究之七:停顿线》 2023-07-31 《K 线形态研究之六:乌云压顶线》 2023-07-31 华创证券研究所 专题报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 2 投资主题 报告亮点 本篇报告作为排序学习系列研究的第二篇报告,首先简单回顾了排序学习的理论基础与算法逻辑,然后深入地介绍了排序学习几种算法的演变并做了简单的推导,最后使用 LGBMRanker 在目标股票池内上构建出基于排序学习的选股模型,表现出色。 投资逻辑 排序学习将个股的价量特征作为参数输入,将其转化为当期对个股未来走势的相对优劣排序。根据历史数据回测,通过持仓排名较前的个股,可以取得一定的相较于等权基准的超额收益。 oPvMnPoPmPtOtPrRwOyRqO6M8QaQoMnNnPoNlOmMyReRmOvN8OqRsONZtOmMxNtQnQ 专题报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 3 目 录 一、什么是排序学习? ............................................................................................................. 5 (一)排序学习的背景 ..................................................................................................... 5 (二)排序学习的特殊之处 ............................................................................................. 5 二、排序学习算法演变 ............................................................................................................. 5 (一)RankNet 介绍 .......................................................................................................... 5 1、概率损失函数 ........................................................................................................... 6 (二)LambdaRank 介绍 ................................................................................................... 6 1、对 RankNet 算法的加速 ........................................................................................... 6 2、梯度函数λ的选取 ..................................................................................................... 8 (三)LambdaMart 介绍 ...........................................................................

立即下载
金融
2023-10-12
华创证券
23页
1.59M
收藏
分享

[华创证券]:【专题报告】基于价量数据的排序学习选股模型,点击即可下载。报告格式为PDF,大小1.59M,页数23页,欢迎下载。

本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 12 潍坊城投存量债券情况
金融
2023-10-12
来源:【债券分析】化债变局下的潍坊城投机会怎么看?
查看原文
图表 11 短久期策略可选债项
金融
2023-10-12
来源:【债券分析】化债变局下的潍坊城投机会怎么看?
查看原文
图表 10 潍坊市各区县经济财政及债务水平
金融
2023-10-12
来源:【债券分析】化债变局下的潍坊城投机会怎么看?
查看原文
图表 9 山东省整体利差与潍坊市利差比较(BP)
金融
2023-10-12
来源:【债券分析】化债变局下的潍坊城投机会怎么看?
查看原文
图表 8 山东各地市利差变动情况(BP)
金融
2023-10-12
来源:【债券分析】化债变局下的潍坊城投机会怎么看?
查看原文
图表 7 潍坊利差 8 月以来下降明显(BP)
金融
2023-10-12
来源:【债券分析】化债变局下的潍坊城投机会怎么看?
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起