学海拾珠系列之二百三十四:利用强化学习和文本网络改进相关矩阵估计
敬请参阅末页重要声明及评级说明 证券研究报告 利用强化学习和文本网络改进相关矩阵估计 ——学海拾珠系列之二百三十四 [Table_RptDate] 报告日期:2025-05-08 [Table_Author] 分析师:骆昱杉 执业证书号:S0010522110001 邮箱:luoyushan@hazq.com 分析师:严佳炜 执业证书号:S0010520070001 邮箱:yanjw@hazq.com [Table_CompanyReport] 相关报告 1. 《风险收益的权衡:宽松型风险平价模型 ——“学海拾珠”系列之二百三十三》 2. 《资产与因子风险预算:一种均衡策略 ——“学海拾珠”系列之二百三十二》 3. 《年报中的叙述式披露对公司价值的多维度影响 ——“学海拾珠”系列之二百三十一》 4. 《“知识”嵌入型深度强化学习在多元资产配置中的应用 ——“学海拾珠”系列之二百三十》 5. 《分解动量:被遗忘的成分 HTP ——“学海拾珠”系列之二百二十九》 6. 《基于树模型的有效前沿扩展 ——“学海拾珠”系列之二百二十八》 7. 《使用深度强化学习解决高维多期环境下的组合配置 ——“学海拾珠”系列之二百二十七》 主要观点: [Table_Summary] 本篇是学海拾珠系列第二百三十四篇,文章提出了一种基于文本的网络的强化学习模型(RL- TBN),用于收缩相关矩阵和协方差矩阵,优化全局最小方差。实证结果显示该方法在降低估计误差、提升投资组合稳健性方面显著优于传统技术。 ⚫ RL-TBN 基于文本的网络的强化学习模型构造 通过融合强化学习的动态优化与文本网络(TBN)的结构化先验,提出了一种数据驱动的协方差矩阵估计框架。在强化学习方面,采用了近似策略优化(PPO)算法,而自然语言处理分析则依靠 TBN来衡量企业间的产品相似性。实施方法与协方差矩阵收缩的文献(Ledoit & Wolf,2022)一致, TBN 设定了目标相关矩阵,而 RL 则以数据驱动的方式确定了收缩强度。 ⚫ RL-TBN 性能 RL-TBN 组合在多个指标上优于传统方法,表现出较低的波动率(0.088),较高的夏普比率(1.351)和较低的 VaR(0.129)。与等权重组合相比,其波动率和夏普比率显著提升。RL-TBN 在不同资产数量和窗口长度下均显示出稳定的优势,且在考虑交易成本后仍保持最佳表现。此外,TBN 对股票相关性和方差的预测有效。 ⚫ RL-TBN 机制分析 TBN 对股票相关性的预测能力强,且其冲击可能导致相关性下降。方差缩减机制验证显示低方差 TBN 组合表现优越。RL 策略对宏观经济不确定性敏感,显示出动态适应性;TBN 与股票相关性的非线性关系验证了 RL 策略调整收缩强度的必要性。 ⚫ 文献来源 核心内容摘选自 Cheng Lu, Papa Momar Ndiaye, Majeed Simaan 于2024 年 11 月 01 日在 International Review of Financial Analysis 上的文章《Improved estimation ofthe correlation matrix using reinforcement learning and text-based networks》。 ⚫ 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 [Table_StockNameRptType] 金融工程 专题报告 [Table_CommonRptType] 金融工程 敬请参阅末页重要声明及评级说明 2 / 28 证券研究报告 正文目录 1 引言 .............................................................................................................................................................................. 4 2 方法 .............................................................................................................................................................................. 6 2.1 收缩方法 --------------------------------------------------------------------------------------------------------------------------------- 6 2.2 文本网络 TBN --------------------------------------------------------------------------------------------------------------------------- 7 2.3 强化学习 --------------------------------------------------------------------------------------------------------------------------------- 9 2.3.1 强化学习的优势 -------------------------------------------------------------------------------------------------------------- 9 2.3.2 RL 问题陈述 ----------------------------------------------------------------------------------------------------------------- 10 2.3.3 近端策略优化 PPO --------------------------------------------------------------------------------------------------------- 11 2.3.4 滚动窗口程序 ---------------------------------------------------------------------------------------------------------------- 12 3 实证分析 .............
[华安证券]:学海拾珠系列之二百三十四:利用强化学习和文本网络改进相关矩阵估计,点击即可下载。报告格式为PDF,大小1.8M,页数28页,欢迎下载。
