金融工程:用树模型提取分析师预期数据中的非线性alpha信息
金融工程 | 金工专题报告 请务必阅读正文之后的信息披露和免责申明 1 金融工程 证券研究报告 2020 年 11 月 25 日 作者 吴先兴 分析师 SAC 执业证书编号:S1110516120001 wuxianxing@tfzq.com 祗飞跃 联系人 difeiyue@tfzq.com 相关报告 1 《金融工程:金融工程-市场情绪一览 2020-11-24》 2020-11-24 2 《金融工程:金融工程-指数样本股交 叉 调 整 背 后 的 综 合 冲 击 效 应 》 2020-11-24 3 《金融工程:金融工程-市场情绪一 览 2020-11-23》 2020-11-23 用树模型提取分析师预期数据中的非线性 alpha 信息 研究目的 用分析师预期数据设计的因子,结构复杂、数据缺失多、与盈利因子、市值类因子相关性高,线性模型未必能够充分提炼其中独有的 alpha 信息。 提升树模型是一种被广泛使用的机器学习方法,模型可以拟合非线性关系,可以自动处理数据缺失问题,使用方法灵活。 报告将提升树模型应用于对分析师预期数据因子和股票收益率建模之中,在确保与盈利类因子、市值类因子低相关的前提下,尝试提取因子中或有的非线性 alpha 信息。 测试方法 报告采用滚动建模的方法,同时使用线性模型和提升树模型,用分析师预期数据因子构建股票收益预测模型。在模型构建过程中,采用统计技术手段,降低模型预测值与盈利类因子和市值类因子之间的相关性,提高预测结果的独立性。 另外,为验证预测结果的有效性,报告用盈利类因子和市值类因子构建了基础股票收益率预测模型,分析预测结果对基础模型的增量效果。 测试结果 测试的数据周期为 2007 年初至 2020 年 10 月。通过测试发现,提升树模型可稳定有效地预测股票收益率,预测值与基础模型预测值相关性均值为 10%。另外,提升树模型与线性模型预测值相关性均值为 50%,提升树模型预测值更适合中小市值股票、而线性模型更适合大市值股票。等权使用两个模型构建的股票组合,其收益表现显著优于单独使用线性模型构建的股票组合,增量收益部分独立,且增量收益部分自 2016 年以来大幅提升。 另外,报告测试了等权模型对基础模型的增量效果。结果显示,在沪深 300 指数增强和中证 500 指数增强策略中,增量收益的年化收益率分别为 1.7%和 2.8%、夏普率分别为 1.65 和 2.20,增量收益与原策略收益相关性分别为-7%和 16%,增量部分独立、稳定、有效。 其他内容 报告构建了完整的滚动训练股票收益率预测模型的流程,介绍和尝试了几种去除相关性的技术方法,丰富了一些数据建模的技术细节,分析了预测模型的风险来源和评估、调整方法。其中提出的一些技术方法和评价指标,适用于一般性的股票收益率预测模型。 风险提示:模型基于历史数据,模型失效风险,因子失效风险,市场环境变动风险 金融工程 | 金工专题报告 请务必阅读正文之后的信息披露和免责申明 2 内容目录 1. 引言 ................................................................................................................................................. 6 2. 因子介绍及结构分析 .................................................................................................................... 6 2.1. 设计和分类 ........................................................................................................................................ 6 2.1.1. 一致预期类 ............................................................................................................................ 6 2.1.2. 评级类 ..................................................................................................................................... 7 2.1.3. 目标价类 ................................................................................................................................ 7 2.1.4. 报告标题超预期类 .............................................................................................................. 8 2.1.5. 常见但未使用的因子 ......................................................................................................... 8 2.2. 结构分析 ............................................................................................................................................ 8 2.2.1. 覆盖率 ..................................................................................................................................... 8 2.2.2. 统计分布 ................................................................................................................................ 8 2.2.3. 与其他类别因子相关性 ..................................................................................................... 9 2.2.4. 时序平稳性
[天风证券]:金融工程:用树模型提取分析师预期数据中的非线性alpha信息,点击即可下载。报告格式为PDF,大小1.11M,页数34页,欢迎下载。
