ChatGLM助力量化选股
证 券 研 究 报 告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载 金融工程 专题报告 2023 年 06 月 14 日 【专题报告】 ChatGLM 助力量化选股 2023 年来市场的风格再次发生大的变化,今年的市场主要围绕 ChatGPT 引领的人工智能浪潮与“中特估”两条主线展开,传统的基本面模型基于历史的基本面信息或者分析师一致预期变化的维度较难取得明显的超额收益,故此,我们尝试从新的角度来做研究,脱离传统的基于纯粹的基本面和简单量价信息的思维,结合时代大环境从人工智能辅助投资的大方向来进行尝试。 构建 ChatGLM 因子 首先利用 ChatGLM 对分析师研报的文本数据进行情感打分并进行分类,以此获得初始的分类标签。其次,利用初始的分类便签与对应的研报文本数据对Bert 模型进行微调获得所需的预测模型参数。对于微调后的模型及参数,我们将样本外的研报文本数据输入并提取其中的【CLS】向量,以此作为后续模型的输入样本。最后,我们使用 Xgboost 模型采用过去半年的样本作为训练数据滚动训练,来对未来一年的个股研报进行情感预测打分,并将过去三个月的所有样本计算平均作为个股的研报情感得分。 Chatglm_factor 原始因子测试 Chatglm_factor 研报情感因子与 Barra 风格因子中的动量因子的相关性较高(0.43)。IC 统计结果发现该因子的 IC 大于 0 占比均超过 60%、IC 的 t 检验显著。该因子 IC 均值、中位数均大于 0.03。另外,其 IC 时间序列可以看出该因子在历史上的表现相对较稳定。从分组测试的结果来看,其得分最高的第10 组年化收益可达 19.92%,信息比率 1.05,年化超额收益 8.5%,另外双边换手率年化仅 10.42。其多空分组的测试结果来看,多空分组的年化收益达 16%,夏普比率 1.19,最大回撤 22%主要发生于 22 年下半年市场整体出现大回撤区间。 Chatglm_factor 纯因子测试 我们对Chatglm_factor因子进行纯化,纯因子历史IC大于0的占比提升到86%,IC 的 t 统计量为 8.88 非常显著。另外,年化 IC_IR 由之前 1.01 提升到 2.93。纯化后的因子 IC 表现更加平稳,红色折线一直维持在 0 轴上方。纯化后的因子第 10 组年化收益可达 19.23%,信息比率 1.72,年化超额收益 7.37%,另外双边换手率年化 11.74;多空分组的年化收益达 14%,夏普比率 2.45,最大回撤仅 3%。 Chatglm_factor 因子选股策略 我们根据每月计算的个股情感得分选取情感得分最高的 50 只个股等权配置,策略在 2014 年 06 月 01 日至 2023 年 6 月 12 日期间年化收益率 20.8%,基准(中证 500)年化收益率 5.3%,阿尔法 15.6%。2014 年 06 月 01 日至 2023 年6 月 12 日以来 2198 个交易日中,获得正收益的天数为 1204 天,盈利天数占比:54.78%,盈利日平均每天盈利 1.2%,亏损日数 994 天,亏损天数占比:45.22%,亏损日平均每天亏损 1.25%。 策略在 22 年整体回撤 15.47%,明显小于主动型基金的收益中位数;2023 年至今(6 月 12 日)绝对收益 13.66%,相对基准超额收益 12.46%,大幅跑赢基准。 风险提示: 策略基于历史数据回测,不保证未来数据的有效性。 证券分析师:秦玄晋 电话:021-20572522 邮箱:qinxuanjin@hcyjs.com 执业编号:S0360522080005 证券分析师:王小川 电话:021-20572528 邮箱:wangxiaochuan@hcyjs.com 执业编号:S0360517100001 相关研究报告 《人工智能助力量化投资——ChatGLM 介绍》 2023-06-14 《基于 canslim 与 FESC 的沪深 300 指数增强策略》 2023-03-07 《行业轮动系列——FESC 行业轮动投资框架1.0》 2022-09-07 《CANSLIM 3.0 投资法——成长与价值轮动》 2022-06-17 《CANSLIM 2.0 投资法——华创金工大师系列成长型之一》 2021-10-16 华创证券研究所 专题报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 2 投资主题 报告亮点 人工智能不仅是今年 A 股市场的主线之一,同时人工智能随着各种技术的突破未来也将深入到各个行业领域。本报告开创性的使用 ChatGLM 来对分析师研报的情感进行打分划分标签,并以此为基础叠加 Bert 大模型与 Xgboost模型构建个股的情感因子。 投资逻辑 近两年来市场风格轮动较大,传统的基于基本面因子与简单量价因子的量化模型相较以往年份较难取得明显的超额收益。本报告结合时代大环境使用ChatGLM 等来构建研报情感因子,通过测试该因子自 2014 年来能取得非常不错的效果,尤其在近两年来以此为基础构建的选股模型超额收益非常明显。 nMvMsQpPsNmQnNnNnRzRqM9PaO9PsQrRnPnOfQqQoQlOmNnQ8OmNtPuOsRrOvPoNsQ 专题报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 3 目 录 一、市场及策略回顾 ................................................................................................................. 6 (一)2023 年至今市场回顾 ............................................................................................ 6 (二)2023 年至今 CANSLIM 策略回顾 ........................................................................ 7 (三)2023 年至今行业轮动策略回顾 ............................................................................ 8 二、利用 ChatGLM 构建选股因子 ......................................................................................... 8 (一)本地部署 ChatGLM 大模型 ....................................................................
[华创证券]:ChatGLM助力量化选股,点击即可下载。报告格式为PDF,大小2.26M,页数28页,欢迎下载。
