金融科技(Fintech)和数据挖掘研究(七):基于机器学习和知识图谱的行业轮动
请务必阅读正文之后的信息披露和法律声明 [Table_MainInfo] 金融工程研究 证券研究报告 金融工程专题报告 2020 年 07 月 21 日 [Table_Title] 相关研究 [Table_ReportInfo] 《量化研究新思维(二十)——基于马氏距离构建新的经济周期指数》2020.07.13 《创业板的估值洼地——国寿安保国证创业板中盘精选 88ETF 投资价值分析》2020.07.10 《做时间的朋友——中证工银财富股票混合基金指数投资价值分析》2020.07.09 [Table_AuthorInfo] 分析师:冯佳睿 Tel:(021)23219732 Email:fengjr@htsec.com 证书:S0850512080006 分析师:张振岗 Tel:(021)23154386 Email:zzg11641@htsec.com 证书:S0850519050001 金融科技(Fintech)和数据挖掘研究(七)——基于机器学习和知识图谱的行业轮动 [Table_Summary] 投资要点: 研究背景。我们在之前的行业轮动系列报告中挖掘了几大类的行业因子,例如,量价、宏观、情绪面、高频因子、预期基本面、历史基本面、公募基金观点等。这些因子通常可以分为两类:行业本身的特征以及基于共同外生变量变动的行业预期收益,但这两类因子都没有考虑行业之间的关联性。因此,在本篇报告中,我们从另一个角度研究行业收益的可预测性:相关行业的滞后收益率。 理论基础。投资者处理信息的能力有限,当某个行业出现信息或冲击时,专门从事相关行业的投资者可能也无法迅速把握冲击的全部影响。因此,信息会逐渐在各个行业间扩散,导致不同行业的股票价格先后响应。这一现象构成了某些行业滞后收益率可以预测其他行业未来收益率的理论基础。 策略逻辑。采用除目标行业外其他行业的滞后收益率,与下一期目标行业收益率构建回归模型。如果只是使用普通最小二乘(OLS)选择全部行业进行回归,容易产生过拟合;如果只选择几个行业因子,又存在很强的主观性。为了解决这些不足,我们引入了机器学习和知识图谱两种方法。 基于 Post-Lasso 的行业轮动策略。模型包含两个步骤:(1)用 Lasso 方法筛选预测变量;(2)用上一步中的预测变量建立回归模型。在 2010/1-2020/4 期间,由此得到的行业轮动策略的多头年化超额收益为 5.36%,空头年化超额收益为-6.38%,多空收益为 11.57%。策略因子化后的 IC 为 0.07,T 值在 3 以上。 用客户-供应商关系构建 A 股行业知识图谱。我们将 FactSet 供应链数据中 A 股上市公司的客户-供应商关系,嵌入 Input-Output 网络,构建 A 股行业的知识图谱。利用知识图谱提供的先验知识,可以确定行业收益率的领先-滞后关系。 基于行业知识图谱的轮动策略。首先,在每个月末根据关系网确定每个行业的预测变量。其次,以 24 个月为窗宽,建立目标行业收益率和预测变量滞后收益率的线性回归模型。最后,预测最新一期的目标行业收益率。在 2017/1-2020/4 期间,由此得到的行业轮动策略多头年化超额收益为 8.44%,空头组合的年化超额收益为-10.84%。多空收益为 19.44%,最大回撤为 10.53%。 风险提示。数据挖掘是从历史先验数据获取经验模型的方法,存在模型失效可能。 金融工程研究 金融工程专题报告 2 请务必阅读正文之后的信息披露和法律声明 目 录 1. 研究背景 .................................................................................................................... 5 2. 基于 Post-Lasso 的行业轮动策略 .............................................................................. 5 2.1 Post-Lasso 方法 ............................................................................................... 5 2.2 Post-Lasso 的行业筛选 .................................................................................... 6 2.3 未选到行业的填补方法 .................................................................................... 7 2.4 Post-Lasso 行业轮动策略的表现 ...................................................................... 8 2.5 参数敏感性分析 ............................................................................................... 9 2.6 和简单动量策略的对比 .................................................................................. 10 3. 基于客户-供应商关系的行业轮动策略 ..................................................................... 11 3.1 从投入-产出关系到行业贸易网络 .................................................................. 11 3.2 基于上市公司的客户-供应商关系构建行业贸易网络 ..................................... 14 3.3 行业轮动策略 ................................................................................................. 15 4. 总结 ......................................................................................................................... 17 5. 风险提示 ..................................................................
[海通证券]:金融科技(Fintech)和数据挖掘研究(七):基于机器学习和知识图谱的行业轮动,点击即可下载。报告格式为PDF,大小1.33M,页数21页,欢迎下载。