科技行业数据超融合系列:ESG研究专题,聚焦“环境”分析升级,探索“主动筛选”数据策略
证券研究报告 请务必阅读正文之后的免责条款 ESG 研究专题——聚焦“环境”分析升级,探索“主动筛选”数据策略 数据超融合系列|2020.10.24 ▍ 中信证券研究部 ▍ 核心观点 张若海 首席数据科技分析师 S1010516090001 在中证 800 标的池内,我们依托政府侧监管数据、环境舆情数据、行业环境数据3 大数据源的融合与 NLP 量化处理,完成了“E”元素的专业性重构,在季度/月频率的条件下,优化了环境因素的评分体系。对应公司的实测效果,A 股上市公司环境治理平均分连年提升,且对于非制造业板块适用性显著提升。 ▍ E 因素数据融合优化路径。构建跨行业通用体系,打造国情特色框架。对于环境因素的评分体系优化,我们建议围绕“国情特色”,“行业可比标准”与“数据高频提升”三个维度提升。对于国情特色,我们关注政府侧监管数据,按照国家级-省市级-第三方进行数据集群构建;对于行业可比标准,我们重点围绕非制造业,梳理基于另类数据的特色化行业指标,形成相对客观的数据评分标准;对于数据频率提升,基于监管等数据实现月度跟踪。。 ▍ E 因素数据源矩阵。以政府侧为核心,融合三方平台数据。我们分别对政府侧监管数据、环境舆情数据、行业环境数据进行了梳理和量化。其中对政府侧监管数据,依托第三方机构“绿网环境”,初步实现了对全国 500 多个环保局网站的全覆盖,实现了对国家级排污许可数据、省级环境信用数据、地市级环境处罚数据的结构化优化;对于环境舆情数据,我们结合 NLP 技术挖掘与环境主题相关的新闻、公告生成舆情指标,实现对公司的关联;对于行业环境数据,我们基于企业社会责任报告梳理了行业通用指标,同时引入了更加客观的卫星数据等另类行业数据。 ▍ E 因素数据源融合技术架构。我们实现了 E 因素数据中子公司对上市公司的部分有效关联,消除公司的规模效应和行业差异,在同一数据源内对企业环境友好度进行量化模拟打分,并基于行业特性对不同数据源进行赋权,采用滑动时间窗口滚动累计近三个月的评分项,最终实现了对 E 因素动态评价体系的有效构建。 ▍ 实战检测:正向择股作用有望提升。根据评分结果,筛选出 Top30 组合,以中证 800 作为基准,对比 2017 年至 2020 年第二季度的累计收益率。在 2017年至 2019 年期间,我们在沪深 300 中对尾部的公司进行剔除,将剩余公司按照市值加权计算收益率,相对沪深 300 有 1.6%超额累计收益率。。 ▍ 应用探索:探索正向选择可能。在上述对 E 因素的评分的测评中,我们可以看到该评分在中小盘没有明显的正向择股效果,但在沪深 300 开始出现正向择股可能,整体看,随着数据维度的提升和打分规范化,主动筛选策略值得期待。 ▍ 风险因素:环境数据官方披露指标变化;三方平台数据接口失效;公司主动数据披露公告覆盖率下降;评价体系非专业性潜在影响;舆情数据不准确影响。 .. ESG 超融合系列研究|2020.10.24 请务必阅读正文之后的免责条款部分 目录 ESG 数据超融合应用建议——围绕 E 因素,全面优化评价体系框架 ............................... 1 E 因素评价体系研究普遍存在几个共性问题 ..................................................................... 1 环境因素升级路径:构建跨行业通用评分体系,打造国情特色数据框架 .......................... 1 E 因素数据源精选与量化处理 ........................................................................................... 3 聚焦政府侧数据,国情特色下量化环境评价 ..................................................................... 3 基于 NLP 量化新闻、公告等文本数据:模拟客观舆情数据指标 ....................................... 4 行业数据:基于 CSR 报告的通用性指标和基于另类数据的特色化指标 ........................... 6 E 因素数据融合技术架构与评分体系构建 ......................................................................... 8 多源环境数据融合:基于专业知识的量化分级与赋权 ....................................................... 8 环境评分动态模型构建:基于滑动时间窗口的动态分数计算 ............................................ 8 E 因素动态评分效果评价 ................................................................................................ 10 和商道融绿对比:评分具有较高的相似性和稳定性 ........................................................ 10 和中证 800 对比:E 因素评分正向受益尚不显著 ............................................................ 10 和沪深 300 对比:E 因素评分正向受益逐步体现 ............................................................ 11 E 因素评分应用探索:逐步构建主动筛选数据策略 ........................................................ 11 数据逐步丰富,正向选择效果有望提升 .......................................................................... 11 风险因素 ......................................................................................................................... 12 rMtPmOyQvN9P8Q9PsQqQsQpPeRoPqQlOnPxPbRoPqOuOqMtRwMpOtR ESG 超融合系列研究|2020.10.24 请务必阅读正文之后的免责条款部分 插图目录 图 1:E 因素三维升级 ................................................................................................
[中信证券]:科技行业数据超融合系列:ESG研究专题,聚焦“环境”分析升级,探索“主动筛选”数据策略,点击即可下载。报告格式为PDF,大小1.23M,页数16页,欢迎下载。