机器学习系列之十:时间序列重采样与多尺度多窗口信息融合模型

请务必阅读正文后的声明及说明 [Table_Info1] 证券研究报告 [Table_Date] 发布时间:2025-08-29 [Table_Invest] 中证 1000 指数增强表现 [Table_Report] 相关报告 《资产负债表财务附注质量因子》 --20250825 《宏观因子组合及股债相关性再探索》 --20250806 《上月预期和流动性因子表现较优》 --20250803 《上月预期、成长和技术因子表现较优》 --20250703 《公募量化发展的回首与展望》 --20250613 [Table_Author] 证券分析师:王琦 执业证书编号:S0550521100001 021-61002390 wangqi_5636@nesc.cn 证券分析师:贾英 执业证书编号:S0550524060004 13666061675 jiaying@nesc.cn [Table_Title] 证券研究报告 /金融工程研究报告 时间序列重采样与多尺度多窗口信息融合模型 ---机器学习系列之十 报告摘要: [Table_Summary] 时间序列的采样方式在一定程度上影响特征的有效性。对于高频量价数据流,常规方法为均匀时间采样。然而这种采样方式可能会导致信息分布不均,比如早盘高成交量时段采样过少导致有效信息过载而被掩盖,午盘低成交量时段有效信息不足但采样过多从而引入噪声。另外,均匀时间采样的时间序列统计特性一般比较差。事件驱动型的采样方式旨在让信息的分布更加均匀,例如基于成交笔数、成交量、成交额等维度进行采样,而并非单一的时间维度。这种等信息量的采样方式在保留较高精细度的同时,尽可能降低了噪声,能够在信息密集时段增加采样频率,而在信息稀疏时段降低采样频率。 不同的时间窗口具有不同的信息侧重,不同的采样频率或尺度选择体现精细度和噪声的权衡。随着回看窗口期的增加,数据含有的信息从日内走势到短期波动,再到长期趋势信息。单一窗口输入通常难以使模型兼顾局部变化和全局趋势。多窗口数据特征的融合能够引导模型更好地提取有效信息,从而增强模型的表现。另一方面,时间序列在不同尺度下呈现出的模式也不尽相同。不同尺度的时序采样能够实现不同程度的降噪以及多样化的模式呈现,综合考虑多尺度下的时间序列特征能够在一定程度上带来增益。 多尺度多窗口信息融合模型对跨窗口共享信息与特异性信息进行解耦,对多尺度数据对应的模型进行集成,具有更优的选股能力。首先在数据端应用事件驱动的采样方式,得到多种尺度的量价时间序列。对每一种尺度下的时间序列进行多窗口划分,模型对多窗口期的特征进行提取,并将其解耦为共享特征与特异性特征,从而尽可能消除多窗口对应特征的冗余性,然后由预测模块进行多窗口特征的整合得到输出。最终对多种尺度对应的模型进行集成。 模型生成的月度与周度因子表现良好。月度因子 Rank IC:15.53%,ICIR:1.73,周度因子 Rank IC:13.05%,ICIR:1.47。消融实验表明,等成交额采样方式的数据有效性强于等时间采样;多窗口信息融合的方式强于单窗口;在融合方式上,信息解耦后融合的方式好于简单拼接或注意力融合;另外多尺度下的结果合成效果好于单尺度。从风险相关性来看,因子在整个回测区间上具有显著的低流动性、低波动、低估值、高盈利的风格暴露。另外,周度因子整体风险暴露弱于月度因子。因子在不同的选股域中均有不错的表现。 指数增强策略稳健性良好。在周单边换手 10%上限的约束下,2018 年 1月至 2025 年 8 月周频调仓的沪深 300 增强组合年化超额收益率 10.27%,跟踪误差 4.29%;中证 500 增强组合年化超额收益率 12.97%,跟踪误差4.93%;中证 1000 增强组合年化超额收益率 20.36%,跟踪误差 5.04%。在严格控制风险暴露和跟踪误差的同时,取得稳定优异的表现。 风险提示:以上分析基于模型结果和历史测算,存在模型失效风险。 请务必阅读正文后的声明及说明 2 / 32 [Table_PageTop] 金融工程研究 目 录 1. 引言 ....................................................................................................................... 5 2. 时间序列重采样 .................................................................................................. 6 3. 融合多尺度多窗口信息的选股模型 .................................................................. 8 3.1. 模型架构 ................................................................................................................................... 8 3.1.1. 多窗口信息融合模型 ................................................................................................................................... 8 3.1.2. 多尺度多窗口信息融合模型...................................................................................................................... 10 3.2. 模型训练与测试 ..................................................................................................................... 11 4. 结果对比 ............................................................................................................ 14 4.1. 消融实验 ................................................................................................................................. 14 4.1.1. 等成交额采样与等时间采样................................

立即下载
综合
2025-09-08
东北证券
32页
2.94M
收藏
分享

[东北证券]:机器学习系列之十:时间序列重采样与多尺度多窗口信息融合模型,点击即可下载。报告格式为PDF,大小2.94M,页数32页,欢迎下载。

本报告共32页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共32页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
表 6 公司核心业务业绩预测
综合
2025-09-08
来源:招金矿业(1818.HK)海外项目加快落地,未来增长可期
查看原文
图 31 同行业黄金公司 2024H1 单位矿产金成本对比
综合
2025-09-08
来源:招金矿业(1818.HK)海外项目加快落地,未来增长可期
查看原文
图 30 公司克金综合成本缓慢上行
综合
2025-09-08
来源:招金矿业(1818.HK)海外项目加快落地,未来增长可期
查看原文
图 29 黄金资源量规模居于同业第三
综合
2025-09-08
来源:招金矿业(1818.HK)海外项目加快落地,未来增长可期
查看原文
表 4 截至 2024 年末公司资源储量情况
综合
2025-09-08
来源:招金矿业(1818.HK)海外项目加快落地,未来增长可期
查看原文
图 28 阿布贾金矿包含三个相邻矿区
综合
2025-09-08
来源:招金矿业(1818.HK)海外项目加快落地,未来增长可期
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起