海外文献速览系列之十六:高频数据下基于文本挖掘和深度学习的股票波动性预测

敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 DONGXING SECURITIES 金融工程 东兴证券股份有限公司证券研究报告 高频数据下基于文本挖掘和深度学习的股票波动性预测 ——海外文献速览系列之十六 2022 年 03 月 09 日 金融工程 定期报告 分析师 高智威 电话:0755-82832012 邮箱:gaozhw@dxzq.net.cn 执业证书编号:S1480521030002 研究助理 贺争盛 电话:18768114667 邮箱:hezhsh@dxzq.net.cn 执业证书编号:S1480121070099 投资摘要: 在开发量化投资策略时,海外优秀论文往往能够提供新的思路和方法,为了能够让各位投资者更有效率地吸收海外的经验,东兴金工团队推出海外文献速览系列报告。我们将定期从海外文献中筛选思路较为新颖且有潜力应用于国内市场投资的文章,以速览的形式呈现给各位投资者,内容涵盖资产配置、量化选股、基金评价以及衍生品投资等多个方面。 本篇报告作为该系列报告的第十六篇,我们选取了 Bolin Lei, Zhengdi Liu, Yuping Song 的文献《On stock volatility forecasting based on text mining and deep learning under high-frequency data》。 金融资产价格的波动在衡量资产风险水平和衍生品定价方面发挥着极其重要的作用。因此,基于波动性特征发现更多预测指标和模型对于分析金融资产风险具有非常重要的理论意义和实用价值。 本文是一篇有关基于深度学习对波动率预测的新兴文献。深度学习在股票市场的应用是一个热门的学术研究领域。尽管在美国市场的研究已经很多,但深度学习方法在中国市场的应用能力仍然有待验证。作者认为深度学习模型的非线性关系拟合能力和强大的数据特征学习能力,为提高波动率预测的准确性提供了新思路。 很少有文献使用包含公众意见的文本信息作为波动率预测的输入指标。作者利用股东的文本评论信息构建了一个文本情绪因子,整合了评论的影响,然后结合波动率预测的其他交易信息,以高频金融数据为基础,采用了深度学习模型长短期记忆(LSTM)进行构建波动率预测模型。作者发现,带有情绪指标的 LSTM 模型对波动率的预测准确率优于没有情绪指标的 LSTM 模型,并且与六种损失函数下的 10 个传统计量经济学模型的多步骤预测相比时,LSTM模型是更稳健的。随着民意指标的加入,LSTM的准确率在六个评价标准 MSE、RMSE、MAE、MSLE 、𝑅2和 RMSPE 下分别提高了 9.3%、4.7%、6.2%、9.2%、7.9%和16.9%,表明股东情绪指标对市场股票股价波动率预测有正向影响。窗口长度的选择也对 LSTM 模型预测的准确性有一定的影响,若窗口时间过小,模型则无法获得足够的数据,若窗口时间过大,数据集会采集到过多的无关数据,影响模型的训练效率,从结果上看,窗口值为 20 时,模型可以达到最优的效果。作者的研究过程和结论提供了一个构建更准确、更稳健的波动率预测模型的新方法,深度学习和文本挖掘技术也被应用到金融时间序列分析中。 风险提示: 本报告内容来源于相关文献,不构成投资建议。文中的结果基于原作者对历史数据的回测,当市场环境发生变化的时候,存在模型失效的风险。 P2 东兴证券金融工程报告 金融工程:高频数据下基于文本挖掘和深度学习的股票波动性预测 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 DONGXING SECURITIES 目 录 1. 研究背景................................................................................................................................................................................................... 4 2. 模型与研究方法....................................................................................................................................................................................... 5 2.1 传统的经济模型 ............................................................................................................................................................................. 5 2.1.1 GARCH 模型....................................................................................................................................................................... 5 2.1.2 HAR-RV 模型...................................................................................................................................................................... 5 2.1.3 ARFIMA 模型 ...................................................................................................................................................................... 6 2.2 深度学习模型-LSTM .................................................................................................................................................................... 6 2.3 预测指标和评估标准 ............................................................................................................................................

立即下载
金融
2022-03-17
东兴证券
22页
1.16M
收藏
分享

[东兴证券]:海外文献速览系列之十六:高频数据下基于文本挖掘和深度学习的股票波动性预测,点击即可下载。报告格式为PDF,大小1.16M,页数22页,欢迎下载。

本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
广发基金在管 ETF 产品(截至 2022.03.07)
金融
2022-03-17
来源:广发中证海外中国互联网30ETF投资价值分析:科技政策推陈出新,互联网仍具增长潜力
查看原文
广发中证海外中国互联网 30ETF(159605)基本概况
金融
2022-03-17
来源:广发中证海外中国互联网30ETF投资价值分析:科技政策推陈出新,互联网仍具增长潜力
查看原文
港股通持有中国互联网 30 指数成分股港股情况统计(单位,亿元)
金融
2022-03-17
来源:广发中证海外中国互联网30ETF投资价值分析:科技政策推陈出新,互联网仍具增长潜力
查看原文
中证海外中国互联网 30 指数研发情况
金融
2022-03-17
来源:广发中证海外中国互联网30ETF投资价值分析:科技政策推陈出新,互联网仍具增长潜力
查看原文
指数市盈率(截至 2022.03.07)图8:指数市净率(截至 2022.03.07)
金融
2022-03-17
来源:广发中证海外中国互联网30ETF投资价值分析:科技政策推陈出新,互联网仍具增长潜力
查看原文
指数前 10 大重仓股(截至 2022.03.07)
金融
2022-03-17
来源:广发中证海外中国互联网30ETF投资价值分析:科技政策推陈出新,互联网仍具增长潜力
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起