“学海拾珠”系列之一百五十二:人工智能可以读懂企业高管的想法吗?
敬请参阅末页重要声明及评级说明 证券研究报告 人工智能可以读懂企业高管的想法吗? ——“学海拾珠”系列之一百五十二 [Table_RptDate] 报告日期:2023-8-2 [Table_Author] 分析师:严佳炜 执业证书号:S0010520070001 邮箱:yanjw@hazq.com 分析师:吴正宇 执业证书号:S0010522090001 邮箱:wuzy@hazq.com 相关报告 1. 《动量、反转和基金经理过度自信——“学海拾珠”系列之一百四十四》 2. 《股票因子个性化:基于股票嵌入的因子优化——“学海拾珠”系列之一百四十五》 3. 《盈余公告披露的现象、方法和目的——“学海拾珠”系列之一百四十六》 4. 《基金抛售资产时的选择性偏差——“学海拾珠”系列之一百四十七》 5. 《投资者情绪能预测规模溢价吗?——“学海拾珠”系列之一百四十八》 6. 《基于强化学习和障碍函数的自适应风险管理在组合优化中的应用——“学海拾珠”系列之一百四十九》 7. 《运用少量 ETF 可以复制主动基金的业绩吗?——“学海拾珠”系列之一百五十》 8. 《A 股流动性、波动性及其溢出效应——“学海拾珠”系列之一百五十一》 主要观点: [Table_Summary] 本篇是“学海拾珠”系列第一百五十二篇,作者利用美国公司定期季报和年报的文本信息,通过情绪模型、词袋模型和大型语言模型(LLM),来预测未来的公司盈余惊喜。实证结果发现,公开披露的公司文件中的积极和消极信息往往隐藏在其大量复杂的文本中,而近期的人工智能模型相比传统模型可以更好的识别信息。回到国内市场,财务报告中的文本信息尚待挖掘,可借鉴本文的研究思路寻找文本中的 alpha。 ⚫ MD&A 部分的长度与公司未来盈余呈负相关 与更复杂的情绪模型相比,管理层讨论与分析(MD&A)或风险因素(RF)章节的词汇长度能够更好地预测未来公司的表现。实证发现,具有较低的 MD&A 长度的公司显著优于具有较高 MD&A 长度的公司。 ⚫ 词袋模型无法从过去公告中“学习”预测未来盈余 文章实证表明,通过训练机器学习算法的词袋模型无法识别未来的积极或消极的盈余惊喜。作者认为传统的 NLP 方法失败的部分原因是公司公告日益增加的长度和复杂性。 ⚫ 经过财务目标训练 LLM 模型可以有效预测未来盈余 依据下个季度的预期盈余惊喜,在月底分为五组投资组合。经过财务目标训练的 LLM 模型在所有的多空投资组合策略都具有经济和统计上的显著并且预测盈余符号正确,显著优于情绪模型和词袋模型。 ⚫ 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 [Table_StockNameRptType] 金融工程 专题报告 [Table_CommonRptType] 金融工程 敬请参阅末页重要声明及评级说明 2 / 25 证券研究报告 正文目录 1 引言 ........................................................................................................................................................................................................ 4 2 数据 ........................................................................................................................................................................................................ 7 3 NLP 方法 ................................................................................................................................................................................................ 9 3.1 词汇(情感-得分)方法 .............................................................................................................................................................. 9 3.2 词袋模型 ..................................................................................................................................................................................... 10 3.2.1 基本机器学习方法 .......................................................................................................................................... 10 3.2.2 线性回归 ........................................................................................................................................................... 10 3.2.3 LM 回归 ............................................................................................................................................................. 10 3.2.4 惩罚线性回归 ......................................................................................................
[华安证券]:“学海拾珠”系列之一百五十二:人工智能可以读懂企业高管的想法吗?,点击即可下载。报告格式为PDF,大小1.67M,页数25页,欢迎下载。
