机器学习系列_数据治理专题(二):ESG数据治理,改善披露不足,并重逻辑与理念
证券研究报告 请务必阅读正文之后第 27 页起的免责条款和声明 ESG 数据治理,改善披露不足,并重逻辑与理念 机器学习系列——数据治理专题(二)|2022.12.19 ▍ 中信证券研究部 ▍ 核心观点 张若海 数据科技首席 分析师 S1010516090001 伍家豪 数据科技分析师 S1010522090002 宋广超 数据科技分析师 S1010522090005 高度结构化的 ESG 数据是开展 ESG 投资的重要基础设施,但是目前国内 ESG数据质量较差,整体信息披露率较低,部分关键指标更是严重缺失,例如碳排放披露率不足 5%,同时由于 ESG 评分结果需要具备可解释性,使得 ESG 数据治理工作难度较大。围绕 ESG 数据治理,我们通过实战案例对数据获取、体系搭建与资产沉淀等不同环节进行介绍与探讨,并对中信证券 ESG 通用评级体系的 39 个指标进行了数据治理剖析。 ▍ ESG 数据披露标准不一,完善程度有待提升,数据治理扮演重要角色。上市公司 CSR 报告是 ESG 评分最重要的数据源之一,报告在信披维度上直接受到 ESG 信披标准影响。国际信披体系发展成熟,多项标准互为补充;国内强调本土国情,但在规范与执行层面均有较大提升空间。2021 年,仅有约 30%的 A 股上市公司披露了 CSR 报告。数据缺失、透明度低等现状容易导致 ESG 理念难以量化与指标失真等问题,因此在完善的披露体系与标准化披露落地形成之前,数据治理将持续扮演重要角色。 ▍ ESG 数据治理方法:因“数”制宜,强调“逻辑”与“理念”的双重可解释性。本质是在披露体系与数据质量不完善的基础上,为了得到更准确结果的处理手段。与其他应用数据治理方法相比,ESG 数据治理更加突出强调可解释性,具体包括但不限于以下维度:底层数据处理逻辑可解释、指标处理流程对 ESG 理念可解释、指标处理结果与公司实际情况可解释、行业间可比的处理逻辑可解释以及最终结果对应用方向可解释。 ▍ ESG 框架搭建中数据治理难点在于,对数据与行业的理解缺一不可。ESG原始数据来源多、形式广,另类数据占比可 45%,需要专业的数据团队或供应商提供有效的数据获取支持;数据标准化难度高,单纯依赖人工处理数据的成本高昂,需要借助机器学习等金融科技手段提升数据处理效率;ESG 框架的可解释性与数据处理的每个环节息息相关,需要研究团队具备足够的 ESG 概念理解、行业理解和数据理解,才能自下而上保证流程的合理性和结果的科学性。 ▍ 中信证券 ESG 评分体系数据治理方法: 贴近国情、聚焦实战。本文结合 A股 ESG 数据现状,分析了中信证券以实战需求为导向的 ESG 评分体系下39 个指标对应的数据治理框架。在数据上我们新引入了第三方数据源,并对指标进行合理调整。在量化方法上,我们对指标按属性进行分类,并依据自身特点选择合适的缺失值补充方案和量化方案。最后以“安全生产处罚”指标的详细过程为例,凸显 ESG 数据处理的可解释性。 ▍ ESG 数据治理过程中的资产沉淀,可以为不同场景引入新数据、新指标。ESG 框架搭建可以分为多个环节,每个环节的数据处理流程都会产生不同维度的数据结果。通过将这些中间数据资产化,可以对 ESG 体系形成可以解释性,也可以对基本面与量化研究形成不同维度的支持。数据治理不同环节的输出,可以通过标准化数据库存储的方式形成结构化的数据资产。 ▍ 风险因素:ESG 相关政策落地不及预期;ESG 数据供应商竞争格局剧变。 机器学习系列——数据治理专题(二)|2022.12.19 请务必阅读正文之后的免责条款和声明 2 目录 ESG 数据披露标准有待完善,数据治理扮演重要角色 ..................................................... 4 国际 ESG 数据披露:体系成熟,互为补充 ....................................................................... 4 国内 ESG 数据披露:强调中国特色,规范标准化与执行力度有待加强 ........................... 9 数据缺失与透明度低,导致流程差异化,或使 ESG 指标失真 ........................................ 11 ESG 数据治理:因“数”制宜,强调逻辑与理念的双重可解释性 ................................. 12 ESG 数据治理流程:以应用场景为导向,自下而上环环相扣 ........................................ 12 ESG 数据治理的鲜明特征:强调可解释性 ..................................................................... 13 ESG 数据治理的难点:对数据与行业的理解缺一不可 ................................................... 14 不同视角下的 ESG 数据治理案例 ................................................................................... 14 ESG 体系构建中的数据治理:贴近国情、聚焦实战 ....................................................... 14 数据获取流程中的数据治理:秩鼎技术——先进技术与高效流程赋能,夯实数据基础 .. 19 数据获取流程中的数据治理:恒生聚源——人机结合打造行业级 ESG 多维数据体系 ... 20 数据治理流程中的资产沉淀:大浪淘沙,层层细化 ........................................................ 22 数据的存储与调用:标准化工具降低维护成本,提升数据资产复用性 ........................... 22 原始指标数据库格式 ....................................................................................................... 23 数值型指标数据库格式 .................................................................................................... 24 ESG 评分数据库格式 ...................................................................................................... 25 风险因素 ...............................................
[中信证券]:机器学习系列_数据治理专题(二):ESG数据治理,改善披露不足,并重逻辑与理念,点击即可下载。报告格式为PDF,大小2.6M,页数28页,欢迎下载。



