机器学习系列报告之三:数据纵横,拓展差分的操作域
敬请参阅最后一页特别声明 -1- 证券研究报告 2019 年 4 月 18 日 金融工程 数据纵横:拓展差分的操作域 ——机器学习系列报告之三 金融工程深度 本篇报告将探讨在运用序列数据的过程中,不同差分操作对数据在模型有效性上带来的影响;利用后移算子将差分概念的操作域从正整数拓展到正实数,并给出一些非整差分的应用。 差分的操作域可以从正整数拓展到正实数域。在直观逻辑上,序列差分的阶数仅能是正整数,而通用利用后移算子与级数展开,可以将操作域扩大到正实数。 大部分指数与股票价格序列无须一阶差分即可满足平稳性要求。很多序列差分的目的是为了满足平稳性条件,但过度差分会使得数据丧失序列记忆性。通过对各个指数与股票的测试,可以发现指数大多仅需 0.7阶差分即可满足平稳性要求,此时差分序列与原序列仍有 0.9 左右相关性。而股票的要达到平稳性所需的最低差分阶数差异较大,但大多数也都不需要至 1 阶差分。 非整差分下的信息熵特征效果更好。运用不同差分阶数下的价格数据计算信息熵效果不同,差分阶数较小时保留信息更多。用 0.7 阶差分价格对数序列计算的信息熵数据配合 RSRS 择时策略能小幅提升信号效果。 利用非整差分能用以优化传统量价因子。用收益率标准差计算的低波因子是常用有效 alph 因子。我们通过测试不同差分下的价格对数序列标准差来尝试优化低波因子效果。经测试,最优差分阶数并非默认的 1阶(收益率)而在 1.4 至 1.5 之间。在 1.5 阶差分下计算的低波因子,在全市场、中证 500、沪深 300 股票池内选过效果均有明显提升。 风险提示:测试结果均基于模型和历史数据,模型存在失效的风险。 分析师 刘均伟(执业证书编号:S0930517040001) 021-52523679 liujunwei@ebscn.com 联系人 胡骥聪 021-52523683 hujicong@ebscn.com 相关研报 《机器学习:开拓金融量化新前沿——机器学习系列报告之一》2019.01 《数据纵横:探秘 K 线结构新维度——机器学习系列报告之二》2019.02 2019-04-18 金融工程 敬请参阅最后一页特别声明 -2- 证券研究报告 目 录 1、 时间序列上预测信息与可推论性的悖论 .................................................................................... 5 1.1、 被牺牲的预测信息 ................................................................................................................................... 5 1.2、 再看作为输入特征的价格与收益率 ......................................................................................................... 5 2、 探寻记忆性与平稳性的平衡 ...................................................................................................... 6 2.1、 差分与非整差分 ...................................................................................................................................... 6 2.2、 非整差分下价格序列的记忆性与平稳性 .................................................................................................. 6 3、 非整差分的一些简单应用 .......................................................................................................... 9 3.1、 不同差分程度下价格序列的信息熵 ......................................................................................................... 9 3.2、 波动因子构造的延伸 ............................................................................................................................. 12 4、 风险提示 ................................................................................................................................. 17 5、 附录 ........................................................................................................................................ 17 2019-04-18 金融工程 敬请参阅最后一页特别声明 -3- 证券研究报告 图目录 图 1:上证综指差分测试........................................................................................................................................... 7 图 2:上证 50 差分测试 ............................................................................................................................................ 7 图 3:沪深 300 差分测试........................................................................................................................................... 7 图 4:中证 500 差分测试....................................................
[光大证券]:机器学习系列报告之三:数据纵横,拓展差分的操作域,点击即可下载。报告格式为PDF,大小4.51M,页数21页,欢迎下载。
