AI投研应用系列之三:基于NARX动态神经网络的指数择时策略

证券研究报告金融工程|深度研究报告基于NARX动态神经网络的指数择时策略马自妍S1190519070001证券分析师:分析师登记编号:刘晓锋S1190522090001证券分析师:分析师登记编号:2025/09/12AI投研应用系列之三:P2请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远1. 时序神经网络概述2. NARX神经网络模型3. 基于NARX模型的指数择时策略构建4. 宽基指数择时测试5. 总结与未来研究方向目录P3请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远在金融时间序列预测领域,神经网络架构经历了从简单感知向复杂时序建模的重要演进。 早期循环神经网络(RNN)首次引入隐状态记忆机制,但存在梯度消失/爆炸问题,难以捕获长期依赖。随后长短期记忆网络(LSTM)及其变体门控循环单元(GRU)通过门控设计较好地解决了长期依赖问题,成为多年来的主流时序建模方案。近年来,时序卷积网络(TCN)依托因果膨胀卷积结构实现了更高效的并行计算与长期依赖建模;而源于自然语言处理的Transformer模型,也凭借自注意力机制在长序列预测中展现出显著潜力。在此背景下,带外部输入的非线性自回归网络(NARX)以其独特的结构设计和良好的可解释性,为多变量金融时间序列预测提供了一个直观而有力的工具。1、时序神经网络概述1.1 时序神经网络的演进与主要模型P4请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远1. 时序神经网络概述2. NARX神经网络模型3. 基于NARX模型的指数择时策略构建4. 宽基指数择时测试5. 总结与未来研究方向目录P5请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远NARX(Nonlinear Auto-Regressive Models with Exogenous Inputs)即带外部输入变量的非线性自回归神经网络,是一种专门为多变量时间序列预测设计的动态递归神经网络。其核心思想直观且符合金融逻辑:未来的值不仅取决于自身过去的历史,还受到一系列外部驱动因素的滞后影响。NARX模型将这一思想数学化,通过非线性函数来学习这种复杂的映射关系。其表达式为:2、 NARX神经网络模型2.1 NARX模型原理𝑦 𝑡 = 𝑓 𝑦 𝑡 − 1 , 𝑦 𝑡 − 2 , … , 𝑦 𝑡 − 𝑑𝑦 , 𝑥 𝑡 − 1 , 𝑥 𝑡 − 2 , … , 𝑥 𝑡 − 𝑑𝑥•𝑥为输入的时间序列,即外部输入变量,可以由多个指标构成。•𝑦为输出的时间序列。•𝑑𝑥为输入变量的滞后阶数。•𝑑𝑦为输出变量的滞后阶数。P6请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远图表1:NARX模型结构资料来源:太平洋证券整理2、NARX神经网络模型2.2 NARX模型结构模型结构主要由四个层级构成:•输入层:接收外部多维信号;•时延层:通过延迟模块处理外部输入和输出反馈信号,生成具有特定滞后的历史数据序列,以提供时序记忆;•隐含层:用非线性激活函数对这些时序信号进行高阶特征提取与复杂映射;•输出层:通过线性加权产生预测值,该值同时反馈回时延层,形成闭环信息流。P7请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远NARX具有开环和闭环两种架构。在训练阶段,采用开环架构,反馈信号来自训练集的真实历史值,避免了误差在训练过程中的累积与传播,提升训练过程的稳定性和收敛速度,使得模型能够高效地学习到输入与输出之间的真实映射关系。在预测阶段,切换至闭环架构,模型将自身前一步的预测值反馈回来,作为下一步预测的输入,这使得模型能够进行真正的多步预测。2、NARX神经网络模型2.3 训练架构图表2:开环架构资料来源:太平洋证券整理图表3:闭环架构资料来源:太平洋证券整理P8请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远➢模型直观,结构可解释性强:NARX的网络结构是对经典线性ARX(Autoregressive with Exogenous inputs)模型的非线性扩展。输入层被明确划分为自回归(AR)和外生输入(X)两部分,使模型架构本身就承载了计量经济学模型的先验知识,可解释性更强,与黑盒模型相比融入了白盒特征。➢分离式输入结构提供可控的分析框架:其结构原生区分目标序列历史值与外部驱动因子,可以独立调控自回归部分与外生部分的滞后阶数、网络复杂度(如为其设计不同的子网络路径),并通过权重来量化不同变量的相对重要性。这种对模型行为的可控性和可验证性,是端到端黑盒模型所缺乏的。➢训练高效且稳定:开环训练模式用真实值进行反馈,有两个优势。第一,前馈网络的输入更准确。第二,生成的网络为纯前馈架构,可以使用静态反向传播进行训练,规避了LSTM、GRU等模型所依赖的随时间反向传播(BPTT)及其固有的梯度问题(消失/爆炸)。这使训练过程的内在稳定性更高,收敛曲线更平滑,对超参数调优的敏感度显著降低。➢数据量需求小,效率更高:通过网络结构内置了“未来状态依赖于其自身及外生输入的历史状态”的强归纳偏置(Inductive Bias),与大多数金融时间序列的逻辑相符。因此,相比于参数更多、偏置更灵活(如Transformer的全局依赖性、LSTM的选择性记忆)的模型,NARX从数据中学习未知规律的需求更小,使其在中等规模数据集上能更快收敛,展现出更优的泛化性能且更不容易过拟合。2、NARX神经网络模型2.4 NARX模型的优势P9请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远NARX在结构性可解释性、训练稳定性和数据效率方面具有优势,而LSTM、TCN和Transformer则在处理更复杂的长期依赖和海量数据场景下各有优势。以下表格对比了各模型的差异:2、NARX神经网络模型2.5 NARX和其他模型的对比图表4:NARX与主流时间序列模型差异对比资料来源:太平洋证券整理模型NARXLSTM/GRUTCNTransformer输出反馈隐藏状态反馈因果膨胀卷积自注意力(非线性ARX)(门控循环单元)(一维卷积网络)(编码器-解码器)高低中中输入分离,易于归因内部状态难以解释可通过卷积核可视化部分模式可通过注意力权重解读特征重要性训练模式优势开环训练等价于静态前馈网络,使用静态反向传播,极其稳定需使用随时间反向传播(BPTT),虽门控机制缓解了梯度问题,但训练仍较复杂可使用标准反向传播,并行度高,训练快但需谨慎设计膨胀系数与感受野使用标准反向传播,并行度最高但计算和内存复杂度高,易过拟合有限强强最强严格依赖于预设的滞后阶数 门控机制专为学习长程依赖设计通过膨胀卷积指数级扩大感受野 注意力机制可直接关联序列中任何位置高中中低强归纳偏置,非常适合中等规模数据需要足够数据来学习门控参数需要足够数据学习有效的卷积核 数据饥渴型,需要海量数据才能充分发挥性能主要适用场景多变量金融预测、需要可解释性、数据量适中的领域通用序列建模,如 NLP、通用时间序列预测长序列预测、需要高训练速度和高并行度的任务超长序列建模、大数据下的NLP时序任务核心机制可解释性长期依赖能力数据效率P10请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远1. 时序神经网络概述2. NARX神经网络模型3. 基于

立即下载
综合
2025-09-22
太平洋证券
31页
1.24M
收藏
分享

[太平洋证券]:AI投研应用系列之三:基于NARX动态神经网络的指数择时策略,点击即可下载。报告格式为PDF,大小1.24M,页数31页,欢迎下载。

本报告共31页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共31页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
表 7 可比公司估值表
综合
2025-09-22
来源:小菜园(0999.HK)供应链拓展为门店扩张奠基,“菜品高标准化%2b门店模型优化”持续强化经营能力
查看原文
表 4 餐饮市场连锁米饭快餐品牌布局情况(取部分品牌)(截至 2025 年 8 月)
综合
2025-09-22
来源:小菜园(0999.HK)供应链拓展为门店扩张奠基,“菜品高标准化%2b门店模型优化”持续强化经营能力
查看原文
表 3 餐饮市场连锁米饭快餐品牌布局情况(取部分品牌)(截至 2025 年 8 月)
综合
2025-09-22
来源:小菜园(0999.HK)供应链拓展为门店扩张奠基,“菜品高标准化%2b门店模型优化”持续强化经营能力
查看原文
表 2 小菜园募集资金用途(截至 2024 年 12 月 31 日)
综合
2025-09-22
来源:小菜园(0999.HK)供应链拓展为门店扩张奠基,“菜品高标准化%2b门店模型优化”持续强化经营能力
查看原文
图 11 小菜园门店分布情况(截至 2025 年 8 月) 图 12 小菜园 25 年各月份开关门店数情况-25 年 6 月起重新步入快车道
综合
2025-09-22
来源:小菜园(0999.HK)供应链拓展为门店扩张奠基,“菜品高标准化%2b门店模型优化”持续强化经营能力
查看原文
图 5 小菜园营业收入(亿元)及增速情况 图 6 小菜园期内利润(亿元)及净利率情况
综合
2025-09-22
来源:小菜园(0999.HK)供应链拓展为门店扩张奠基,“菜品高标准化%2b门店模型优化”持续强化经营能力
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起