机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例

请阅读最后评级说明和重要声明 1 / 32 [Table_MainInfo] ┃研究报告┃ 机器学习 2018-2-7 机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例 金融工程┃专题报告报告要点 机器学习问题和其流程机器学习问题本质上在于找出使得经验风险泛函(样本误差)最小的建模流程,基本的流程可以分为特征工程、模型训练和模型融合。本篇就上述三个过程,给出相关算法的介绍,并补充了之前系列报告中未详细介绍的内容。 机器学习三大步骤特征工程包含特征构建、特征提取和特征选择三个过程,以选择相对最优的特征空间。特征工程往往会采用无监督和有监督的机器学习算法。机器学习模型可以分为线性模型、树模型和深度学习模型。线性模型主要体现了数据中的线性关系,如输入与输出的线性关系,点集的线性可分;树模型可以很好的捕捉输入与输出的非线性关系,和线性模型相辅相成。一些改进的随机梯度下降法可以很好地训练深度学习模型。模型融合有横向拼接和纵向拼接两种方式,在模型融合过程中,往往要求模型表现好,且之间的相关性小。深度学习可以将模型融合通过网络结构的设计在模型训练中完成。 多因子选股案例目前多因子选股模型多以单个模型在整个特征空间上的预测构建策略,往往很难保证函数空间上的一致性,而机器学习流程选股通过在大的函数空间中选择多个小的函数空间进行合并,得到更为完善的模型,可以在估计函数空间上更加逼近实际函数空间。本文以提升树模型、ExtraTrees 模型和深度神经网络模型进行横向拼接,加权平均模型输出的伪概率,构建投资组合。融合模型超额年化收益为 25.91%,夏普比为 1.06,信息比为 2.26,月度超额胜率为 0.76,在超额收益、夏普比、信息比及月度超额胜率上表现略优于单个模型,且在分组投资组合的区分上更为明显。 [Table_Author]分析师 覃川桃 (8621)61118766 qinct@cjsc.com.cn 执业证书编号:S0490513030001 联系人 郑起 (8621)61118706 zhengqi2@cjsc.com 联系人 杨靖凤 (8621)61118736 yangjf@cjsc.com.cn 分 析 师 [Table_Doc]相关研究 《机器学习白皮书系列之三:深度学习的方法介绍及金融领域应用实例》2018-1-22 《红利策略:展望 2018》2018-1-14 《鹏华基金指数型产品的投资价值分析》2018-1-2 风险提示: 1. 模型在使用中存在建模风险; 2.本文举例均是基于历史数据不保证其未来收益。 请阅读最后评级说明和重要声明 2 / 32 金融工程丨专题报告 目录 机器学习流程介绍 ........................................................................................................................ 4 机器学习问题 .......................................................................................................................................................... 4 “方差”与“偏差” ............................................................................................................................................... 4 机器学习三大步骤 ................................................................................................................................................... 5 特征工程 ....................................................................................................................................... 5 特征构建 ................................................................................................................................................................. 6 特征提取 ................................................................................................................................................................. 6 主成分分析 ...................................................................................................................................................................... 6 独立成分分析 .................................................................................................................................................................. 7 限制波尔兹曼机 ............................................................................................................................................................... 7 特征选择 ................................................................................................................................................................. 7 过滤式 .............................................................................................

立即下载
信息科技
2018-06-25
长江证券
32页
1.74M
收藏
分享

[长江证券]:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例,点击即可下载。报告格式为PDF,大小1.74M,页数32页,欢迎下载。

本报告共32页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共32页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 12: 中金公司估值表
信息科技
2018-06-25
来源:软件及服务、技术硬件及设备行业:计算机板块基金持仓比例下降至TMT倒数第二位
查看原文
图表 11: 计算机(中信)板块的 PE(TTM)变动
信息科技
2018-06-25
来源:软件及服务、技术硬件及设备行业:计算机板块基金持仓比例下降至TMT倒数第二位
查看原文
图表 9: 2017 年 Q4 基金持仓机构数变化 TOP20
信息科技
2018-06-25
来源:软件及服务、技术硬件及设备行业:计算机板块基金持仓比例下降至TMT倒数第二位
查看原文
图表 7: 2017 年 Q4 基金持仓市值变化 TOP20
信息科技
2018-06-25
来源:软件及服务、技术硬件及设备行业:计算机板块基金持仓比例下降至TMT倒数第二位
查看原文
亿元)
信息科技
2018-06-25
来源:软件及服务、技术硬件及设备行业:计算机板块基金持仓比例下降至TMT倒数第二位
查看原文
亿元)
信息科技
2018-06-25
来源:软件及服务、技术硬件及设备行业:计算机板块基金持仓比例下降至TMT倒数第二位
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起