金融科技(Fintech)和数据挖掘研究(三):量化因子的批量生产与集中管理
请务必阅读正文之后的信息披露和法律声明 [Table_MainInfo]金融工程研究 证券研究报告 金融工程专题报告 2019 年 06 月 17 日 [Table_Title]相关研究 [Table_ReportInfo] 《听海外高频交易专家讲解美国的高频交易》2019.06.11 《中证红利低波指数及华泰柏瑞中证红利低波 ETF 及其联接基金投资价值分析》2019.06.11 《选股因子系列研究(四十八)——探索A 股的五因子模型》2019.05.28 [Table_AuthorInfo]分析师:冯佳睿 Tel:(021)23219732 Email:fengjr@htsec.com 证书:S0850512080006 分析师:余浩淼 Tel:(021)23219883 Email:yhm9591@htsec.com 证书:S0850516050004 金融科技(Fintech)和数据挖掘研究(三)——量化因子的批量生产与集中管理 [Table_Summary]投资要点: 量化因子计算可以定义为一种基于初等计算函数与一阶谓词逻辑的递归过程。量化因子的本质是股票的某种数量化特征,一般需要通过对股票某些数量信息进行计算得到。与计算机函数从“函数输入出发,输入函数计算,得到函数输出”相类似,量化计算过程也可以拆解为“从量化指标出发,输入量化计算,得到新量化指标”。由此可见,计算机函数构成的基本逻辑——递归过程也同样适用于因子计算架构。 定义量化指标的计算过程有计算机语言与 XML 文本两种方式。由于 λ 算子与图灵机、递归函数等价,因此无论是基于 λ 算子的函数式编程语言,还是基于图灵机的过程、命令范式语言,都可以用来构建量化计算过程。在定义逻辑结构较为复杂的因子时,过程、命令范式语言较为合适。而当需要批量生产因子时,可以表达递归逻辑的 XML 文本也可以作为递归逻辑描述语言来使用。 利用自动因子生成器暴力挖掘因子是生产有效因子的重要方式。利用自动因子生成器构建的 226 个突破型因子,其中有 20%-30%在截面上有较好的选股效果。然而,经正交后,效果明显下降。这说明,暴力挖掘方式还是能获取一部分传统因子构建过程中没有挖掘到的信息,但毕竟两种方式具有相同的初始算根,有大量信息被传统因子所解释。 利用逐笔数据构建的高频因子有着非常突出的效果。构建买入大单成交额占比因子,其截面表现非常优异。利用正交后的因子构建等权组合,可获得接近 20%的多空年化收益与 9 左右的收益回撤比。高频数据的处理成本非常高,目前只能进行 15 年 8 月以来的短周期回测,所以,因子表现的稳定性需要进一步跟踪。 自动构建数据表是进行因子自动化管理的关键要素。依据因子结构进行因子数据库管理是因子计算自动化的重要步骤,而自动构建 SQL 语句,对数据表进行增删查改是实现这种自动化管理的关键技术。 风险提示。数据挖掘是从历史先验数据获取经验模型的方法,存在模型失效可能。 21155992/36139/20190617 15:48 金融工程研究 金融工程专题报告 2 请务必阅读正文之后的信息披露和法律声明 目 录 1. 计算机视角下的量化因子计算过程 ............................................................................ 5 2. 量化因子计算过程的实现 .......................................................................................... 6 3. 基于日频数据的量化因子构建 ................................................................................... 6 3.1 日频初始量化指标计算过程 ............................................................................ 6 3.2 日频量化指标计算算子 .................................................................................... 7 3.3 利用计算机语言表达量化计算过程的递归逻辑 ............................................... 8 3.4 利用量化计算过程构建自动因子生成器 ........................................................ 10 4. 基于高频数据的量化因子构建 ................................................................................. 12 4.1 高频初始量化指标计算过程 .......................................................................... 12 4.2 高频量化计算算子 ......................................................................................... 13 4.3 基于高频初始计算过程的高频成交因子 ........................................................ 14 5. 因子自动管理系统框架 ............................................................................................ 16 6. 总结 ......................................................................................................................... 17 7. 风险提示 .................................................................................................................. 17 21155992/36139/20190617 15:48 金融工程研究 金融工程专题报告 3 请务必阅读正文之后的信息披露和法律声明 图目录 图 1 量化因子计算的基本过程 ........................................................
[海通证券]:金融科技(Fintech)和数据挖掘研究(三):量化因子的批量生产与集中管理,点击即可下载。报告格式为PDF,大小1.18M,页数21页,欢迎下载。



