文本大数据分析在经济学和金融学中的应用

No.C2018013 2018-11-15 文本大数据分析在经济学和金融学中的应用: 一个文献综述 沈艳 、陈赟、黄卓 北京大学国家发展研究院 摘要 本文对文本大数据分析在经济学和金融学中应用的文献进行综述。文本大数据具有数据来源多样化、数据量增长快和时频高的特征,能够为经济学和金融学研究提供新的信息和独特的分析视角,但是处理文本大数据存在许多挑战。我们梳理了文本大数据的信息提取步骤,总结了常用的词典法、机器学习方法和深度学习方法的实现原理和技术特点。在经济学研究领域中,文本大数据主要用于测度经济和政策不确定性、基于文本的行业动态分类、度量和预测商业周期,以及量化媒体的政治倾向等问题。在金融学研究领域,文本大数据主要用于度量投资者和媒体关注度、不同市场参与主体的情绪、基于新闻的隐含波动率以及投资者的意见分歧等指标。我们对这些应用研究的数据来源、处理方法和分析结果进行了全面的梳理。在此基础上,本文还讨论了基于文本大数据的实证分析的新特征以及未来可能的研究趋势。 关键词:文本大数据,机器学习,深度学习,不确定性,投资者情绪 JEL 分类号: C42, G12, G14 文本大数据分析在经济学和金融学中的应用: 一个文献综述1 沈艳 (Yan Shen) 单位:北京大学国家发展研究院,北京大学数字金融研究中心 National School of Development, Peking University Institute of Digital Finance, Peking University 联系电话: 邮箱:yshen@nsd.pku.edu.cn 陈赟 (Yun Chen) (通讯作者) 单位:北京大学国家发展研究院 National School of Development, Peking University 通讯地址:北京大学国家发展研究院, 100871 联系电话: 邮箱:yunchen@pku.edu.cn, 黄卓 (Zhuo Huang) 单位:北京大学国家发展研究院,北京大学数字金融研究中心 National School of Development, Peking University Institute of Digital Finance, Peking University 联系电话: 邮箱:zhuohuang@nsd.pku.edu.cn 1 本研究受国家自然科学基金面上项目(编号 71671004)和国家社会科学基金重大项目(编号18ZDA091)资助。 1 文本大数据分析在经济学和金融学中的应用: 一个文献综述 本文对文本大数据分析在经济学和金融学中应用的文献进行综述。文本大数据具有数据来源多样化、数据量增长快和时频高的特征,能够为经济学和金融学研究提供新的信息和独特的分析视角,但是处理文本大数据存在许多挑战。我们梳理了文本大数据的信息提取步骤,总结了常用的词典法、机器学习方法和深度学习方法的实现原理和技术特点。在经济学研究领域中,文本大数据主要用于测度经济和政策不确定性、基于文本的行业动态分类、度量和预测商业周期,以及量化媒体的政治倾向等问题。在金融学研究领域,文本大数据主要用于度量投资者和媒体关注度、不同市场参与主体的情绪、基于新闻的隐含波动率以及投资者的意见分歧等指标。我们对这些应用研究的数据来源、处理方法和分析结果进行了全面的梳理。在此基础上,本文还讨论了基于文本大数据的实证分析的新特征以及未来可能的研究趋势。 关键词:文本大数据,机器学习,深度学习,不确定性,投资者情绪 JEL 分类号: C42, G12, G14 A Literature Review of Textual Analysis in Economic and Financial Research Abstract: This paper conducts a literature review of textual analysis in economic and financial studies. Textual data exhibit the characteristics of diverse data source, rapidly growing data volume and high frequency. While textual data bring new information and perspectives in economic and financial research, many challenges remain in effectively dealing with textual data. We summarize the procedures of extracting information from textual data and discuss mechanism and features of the popular methods such as dictionary-based approach, machine learning and deep learning approaches. In economic research, textual data have been used in measuring economic policy uncertainty, text-based network industry classification, monitoring and predicting business cycle and quantifying media slant. In financial research, textual data have been used in measuring investor attention and sentiment, news implied VIX and investor disagreement. We review the data sources, approaches and empirical results of these studies. Finally, we summarize the features of using textual analysis in empirical studies and point out future research directions in this field. Keywords: Textual analysis, Machine learning, Deep learning, Uncertainty, Investor sentiment JEL Classification: C42, G12, G14 2 一、 引言 得益于互联网的快速发展和

立即下载
信息科技
2019-01-16
北大国发院
26页
1.26M
收藏
分享

[北大国发院]:文本大数据分析在经济学和金融学中的应用,点击即可下载。报告格式为PDF,大小1.26M,页数26页,欢迎下载。

本报告共26页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共26页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
相关公司盈利预测与评级(取 20181207 日收盘价)
信息科技
2018-12-25
来源:电子行业2019年投资策略报告:5G创新,电子行业近十年一遇的机会
查看原文
2018-2020 年 5G 业务收入弹性预测
信息科技
2018-12-25
来源:电子行业2019年投资策略报告:5G创新,电子行业近十年一遇的机会
查看原文
全球 4G 及 5G 宏基站 PCB 价值量
信息科技
2018-12-25
来源:电子行业2019年投资策略报告:5G创新,电子行业近十年一遇的机会
查看原文
5G 大规模阵列天线板(64 通道)产品图 图 65:5G 有源天线结构图
信息科技
2018-12-25
来源:电子行业2019年投资策略报告:5G创新,电子行业近十年一遇的机会
查看原文
高频基材与高速基材应用场景对比
信息科技
2018-12-25
来源:电子行业2019年投资策略报告:5G创新,电子行业近十年一遇的机会
查看原文
华为 AAU 的有源天线解决方案
信息科技
2018-12-25
来源:电子行业2019年投资策略报告:5G创新,电子行业近十年一遇的机会
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起