因子选股系列之八十九:分析师情感调整分数ASAS

有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 金融工程 | 专题报告 研究结论 ⚫ 分析师情感调整分数(Analyst Sentiment Adjusted Score,ASAS)。该因子通过分析师的研报标题和摘要文本序列来捕捉他们对股票的看法,并结合盈利预测调整值作为标签来训练模型。使用双层 Transformer 和一维卷积网络提取特征,并计算过去三个月内某只股票的情感打分均值作为量化选股因子,全样本 Rank IC 均值为 0.04,ICIR 为 2.0。 ⚫ 自然语言处理(NLP)旨在让计算机理解和处理人类语言。自 20 世纪中叶起,NLP 历经多次发展,涌现出 ELIZA、BoW 词袋模型、Word2Vec 等技术。2017年,基于多头自注意力机制的 Transformer 模型问世,开启了预训练语言模型(T-PTLMs)时代,包括 BERT、GPT-n 和 XLNet 等,在各项自然语言处理任务中取得显著成绩。 ⚫ 相比于前一篇研究所使用的词袋模型,此次的研报情感打分,我们使用 500 词的长文本序列作为输入,使用 1228 万词的腾讯词库进行精准分词,并用 200 维的腾讯词向量作为词嵌入的预设权重,用逆概率密度函数(IPDF)对标签进行标准化,经过众多 NLP 模型的基线对比后,选定 Transformer 作为基础模型。 ⚫ 我们采用双层 Transformer Encoder 和 一维卷积作为最终的训练模型结构,一维卷积在基线对比时就体现了极强的特征提取能力,配合多头注意力机制,能提炼出文本中的段落相关性,和微妙的情感表达。 ⚫ ASAS 因子在沪深 300、中证 500、中证 1000 样本空间中的 Rank IC 分别为0.047、0.041、0.037,预测能力较为稳定,各个样本空间的 ICIR 均大于 1,因子稳定性较高。在中证 500、中证 800 和中证 1000 样本空间中表现出较高的超额年化收益率,尤其在中证 1000 样本空间中表现最优。此外,中证 1000 样本空间中,年化波动率相对较低,显示出较低的风险特征。 ⚫ ASAS 因子在 IC 相关性上和标签、WFR 的 IC 相关性较高,标签的 Rank IC 均值为 0.035,ICIR1.4,WFR 的 Rank IC 均值为 0.029,ICIR1.3,ASAS 的Rank IC 均值为 0.040,ICIR2.0,说明模型的升级很好地修正了分析师的盈利预测调整,使得选股能力和稳定性同步提升。 风险提示 量化模型失效风险、市场极端环境冲击 报告发布日期 2023 年 03 月 28 日 刘静涵 021-63325888*3211 liujinghan@orientsec.com.cn 执业证书编号:S0860520080003 香港证监会牌照:BSX840 薛耕 xuegeng@orientsec.com.cn 基于偏股型基金指数的增强方案:——因子选股系列之八十八 2023-03-06 分析师研报类 alpha 增强:——因子选股系列之八十七 2023-02-17 研报文本情感倾向因子:——《因子选股系列研究之八十六》 2022-12-06 分析师情感调整分数 ASAS ——因子选股系列之八十九 金融工程 | 专题报告 —— 分析师情感调整分数 ASAS 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 1. NLP 综述 ................................................................................................. 4 2. 数据说明 ................................................................................................. 4 2.1 分词 ....................................................................................................................... 4 2.2 标签盈利预测调整 .................................................................................................. 5 2.3 词嵌入 ................................................................................................................... 6 3. 模型对比 ................................................................................................. 7 3.1 NLP 模型介绍 ........................................................................................................ 7 3.2 基线对比 ................................................................................................................ 7 3.3 最终模型:双层 Transformer+一维卷积 ................................................................. 8 4. 因子表现 ............................................................................................... 10 4.1 单因子表现 .......................................................................................................... 10 4.2 因子相关性 .......................................................................................................... 13 5. 风险提示 ...................................

立即下载
金融
2023-04-06
东方证券
17页
1.76M
收藏
分享

[东方证券]:因子选股系列之八十九:分析师情感调整分数ASAS,点击即可下载。报告格式为PDF,大小1.76M,页数17页,欢迎下载。

本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图 2 指标类别及变化计算
金融
2023-04-06
来源:行业景气轮动研究之四:行业景气驱动模型的动态改进与因子拆解
查看原文
图 1 行业中观因子的应用
金融
2023-04-06
来源:行业景气轮动研究之四:行业景气驱动模型的动态改进与因子拆解
查看原文
图39.禾丰转债平价(元)与转股溢价率(%)波动
金融
2023-04-06
来源:谋定后动:重点行业转债情况梳理(下)
查看原文
图37.禾丰股份营业收入(亿元)与增速(%) 图38.禾丰股份归母净利润(亿元)与增速(%)
金融
2023-04-06
来源:谋定后动:重点行业转债情况梳理(下)
查看原文
图36.牧原转债平价(元)与转股溢价率(%)波动
金融
2023-04-06
来源:谋定后动:重点行业转债情况梳理(下)
查看原文
图34.牧原股份营业收入(亿元)与增速(%) 图35.牧原股份归母净利润(亿元)与增速(%)
金融
2023-04-06
来源:谋定后动:重点行业转债情况梳理(下)
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起