量化专题报告:估值因子法预测股指期货收益率
华泰期货研究所 量化组 陈维嘉 量化研究员 0755-23991517 chenweijia@htfc.com 从业资格号:T236848 投资咨询号:TZ012046 华泰期货|量化专题报告 2018-07-31 估值因子法预测股指期货收益率 估值因子简介 股票指数的收益率是由其指数成份股构成的,因此指数会受到其成份股价格、财务等信息变化的影响。每只股票对股票指数的收益率都会存在一定的贡献。如果能够找到影响各个股票的共同因子,就有可能对股票指数的收益率进行预测。这篇报告主要参照 Bryan Kelly和 Seth Pruitt 在 2013 年论文 Market Expectations in the Cross-Section of Present Values 中提出数值方法构造中国股票指数的估值因子。Bryan Kelly 和 Seth Pruitt 认为美国股票市场的整体收益率是可以预测的,他们认为美国股票市场整体年度收益率中有高达 13%的样本外变化可以用过去每只股票的账面市值比解释。Bryan Kelly 和 Seth Pruitt 利用偏最小二乘法从每只股票的账面市值比中提取出隐藏变量作为估值因子,用于预测市场整体收益率。 这篇报告把上证 50 指数,沪深 300 指数和中证 500 指数作为市场整体,利用这三个指数成份股的账面市值比构建估值因子,用于预测这三个指数的收益率。由于这三个指数都已经推出了对应的股指期货,因此可以根据预测收益率的正负进行做多或做空的交易。本报告测试了按照月度和周度两个频率去截取数据,在不同数据频率上各个股指期货的收益略有不同,但是从长期看都能获得年化 10%以上收益,而且均高于指数纯多头策略。 华泰期货|量化专题 2018-07-31 2 / 13 研究背景 股指期货与相应的股票指数挂钩,通常股指期货与股票指数的相关性达到 90%以上,因此如果能有效预测股票指数的收益率就能够通过股指期货进行交易赚取利润。股票指数通常是由一揽子股票根据其市值进行加权平均构成。也就是说影响股票指数涨跌的信息是分散到每只股票当中的,如果能够从股票指数成份股中推断出影响每只股票涨跌的隐含因子,就有可能利用这些隐含因子对股票指数进行预测。Bryan Kelly 和 Seth Pruitt 在 2013 年论文Market Expectations in the Cross-Section of Present Values 中就利用了美国股票市场中每只股票的账面市值比去构造全市场的隐含因子,并把这个隐含因子与市场期望收益率联系起来。这个模型背后的原理是驱动全市场股票期望收益率的隐含因子同样主导了市场上具体个股的估值。股票指数成份股的众多个股样本相当于提供了丰富的截面信息从而能够有效地对全市场,也就是股票指数的期望收益进行估计。 股票指数的成份股每半年就会调整一次,把业绩不好的股票剔除掉,业绩好的股票增加进去,所以能进入成份股的股票都是在某段时间内业绩相对较好的股票。这个业绩好的时间段就造成了这只股票可回溯的时间相当有限。例如沪深 300 指数包含了 300 只成份股,但是如果按月度来回溯,每只成份股在时间序列上的可观测点就变得相当有限了。比如一只上市 10 年的股票就只有 120 个月度的观测点。而作为预测因子的成份股却有 300 个,所以数据的维度是要远远大于样本数量的。在数值方法层面上这属于高维度问题,很难直接用最小二法把股指收益率对 300 只股票的信息进行回归。因此这里用到的一个特殊的数值方法叫偏最小二乘法(Partial Least Squares, PLS)去处理高维度数据问题,这个方法能够根据预测目标对高维度数据进行降维压缩。Bryan Kelly 和 Seth Pruitt 就是用了这个方法从大量股票的账面市值比中构造出单一隐含因子去预测总体市场的收益率。这篇报告就是把Bryan Kelly和 Seth Pruitt 的方法应用到中国股票指数的预测上,并通过股指期货构建交易策略。 估值因子法原理 假设在时刻𝑡上存在一组大小为𝐾𝐹 × 1的估值因子向量𝐹𝑡,使得每只股票指数成份股𝑖的预期收益率在时刻𝑡 + 1上可以表示为 𝔼𝑡[𝑟𝑖,𝑡+1] = 𝛾𝑖,0 + 𝛾𝑖′𝐹𝑡 (1) 其中𝐹𝑡是作用在所有股指成份股上的共同估值因子,它随时间变化而变化,但每只股票的收益率受此共同估值因子𝐹𝑡的作用却只由这股票自身的𝛾𝑖,0和𝛾𝑖′决定。而这个估值因子𝐹𝑡也与股指预期收益率𝔼𝑡[𝑟𝑡+1]存在线性关系,即 华泰期货|量化专题 2018-07-31 3 / 13 𝔼𝑡[𝑟𝑡+1] = 𝛾0 + γ′𝐹𝑡 (2) 其中的𝛾不包含下标,代表的是估值因子𝐹𝑡对股票指数的影响。 同时假设每只股指成份股𝑖的对数账面价值比𝜈𝑖,𝑡与它在𝑡 + 1时刻的预期收益率𝔼𝑡[𝑟𝑖,𝑡+1]存在线性关系 𝜈𝑖,𝑡 = 𝜌𝑖,0 + 𝜌𝑖𝔼𝑡[𝑟𝑖,𝑡+1] (3) 由公式(1)和(3)可知股指成份股𝑖的对数账面价值比𝜈𝑖,𝑡与因子向量𝐹𝑡也存在线性关系 𝜈𝑖,𝑡 = 𝜙𝑖,0 + 𝜙𝑖′𝐹𝑡 (4) 如果能根据公式(4),从每只股指成份股的对数账面市值比𝜈𝑖,𝑡中提取出具有预测作用的隐含估值因子𝐹𝑡后,就能根据公式(2)对股指收益率进行预测。 由于用到的股指成份股截面数据维度较高,这里使用偏最小二乘法对估值因子𝐹𝑡进行构造。其中详细的数学原理可以参考 Bryan Kelly 和 Seth Pruitt 在 2012 年的论文 The three-pass regression filter: A new approach to forecasting with many predictors。如果需要构造的估值因子𝐹𝑡只包含一个标量,即𝐾𝐹=1 时,估值因子𝐹𝑡的构造可以通过以下流程进行简化。 第一步,把每只股指成份股𝑖,不同时刻𝑡的对数账面市值比𝜈𝑖,𝑡对未来𝑡 + 1时刻的股指收益率𝑟𝑡+1进行最小二乘回归: 𝜈𝑖,𝑡 = 𝜙̂𝑖,0 + 𝜙̂𝑖𝑟𝑡+1 (5) 得到每只股票的因子载荷𝜙̂𝑖,0和𝜙̂𝑖,这两个参数是用来描述每个𝜈𝑖,𝑡对驱动预测目标𝑟𝑡+1的隐含估值因子𝐹𝑡的敏感性。每个𝜈𝑖,𝑡对未来收益率𝑟𝑡+1只产生一小部分贡献。 第二步做截面回归,在每一个时刻𝑡上把每只股票的对数账面市值比𝜈𝑖,𝑡对因子载荷𝜙̂𝑖进行最小二乘回归得到当前时刻𝑡上的估值因子𝐹̂𝑡。 𝜈𝑖,𝑡 = 𝑐̂𝑡 + 𝐹̂𝑡𝜙̂𝑖 (6) 在这一步里,第一步得到的因子载荷变成了独立变量,而隐含的估值因子𝐹𝑡就成了待定系数。第一步和第二步就是为了把股指成份股的账面市值比所包含的信息进行压缩,得到一个随时间变化的估值因子𝐹̂𝑡。由于因
[华泰期货]:量化专题报告:估值因子法预测股指期货收益率,点击即可下载。报告格式为PDF,大小1.48M,页数13页,欢迎下载。
