科技行业动态点评:TurboQuant,存储板块的“DeepSeek”时刻?

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 科技 TurboQuant:存储板块的“DeepSeek” 时刻? 华泰研究 科技 增持 (维持) 何翩翩 研究员 SAC No. S0570523020002 SFC No. ASI353 purdyho@htsc.com +(852) 3658 6000 易楚妍 联系人 SAC No. S0570124070123 SFC No. BXH065 yichuyan@htsc.com +(86) 21 2897 2228 韩冬冰* 联系人 SAC No. S0570125070150 handongbing@htsc.com +(86) 21 2897 2228 2026 年 3 月 27 日│中国内地 动态点评 谷歌早在 25 年 4 月即在 arXiv 发表 TurboQuant 论文,但当时并未引起市场关注。直至 26 年 3 月 24 日,公司通过官方博客正式发布相关研究成果,并同步入选 ICLR 2026,该工作才迅速获得市场关注,并触发存储板块阶段性回调。从市场反应来看,此次事件与 2025 年 1 月 DeepSeek 事件具有较高相似性。DeepSeek R1 曾被市场解读为显著降低前沿模型训练所需算力,而 TurboQuant 则被理解为大幅压缩推理阶段的内存需求。两者在短期内均引发市场对 AI 基础设施投入的下修预期。但从实际结果来看,DeepSeek并未抑制 GPU 需求,反而通过成本下降加速 AI 应用渗透,带动云厂商资本开支指引持续上修。其背后逻辑,本质上体现“杰文斯悖论”,效率提升并不会压缩资源总需求,而是通过提升可及性,推动技术在更大规模上的扩张。我们认为,TurboQuant 同样遵循这一逻辑。本质上,其是一种无需训练 KV Cache 压缩方法,核心依托两项关键技术:1) PolarQuant 通过将 key/value向量转化为极坐标表示,规避高成本的分块归一化计算;2)Quantized Johnson-Lindenstrauss(QJL)通过随机高斯投影结合符号二值化,进一步压缩残差误差。从效果来看,在不影响模型精度的情况下,TurboQuant可实现约 6x KV Cache 内存压缩以及 8x attention logit 计算速度提升。 TurboQuant 对 HBM 与 DRAM 尚难形成实质性影响 我们认为,TurboQuant 尚难以对 HBM 及 DRAM 需求形成实质性影响。我们认为,HBM 需求核心仍在训练侧,主要承载模型权重、激活值等关键数据,上述环节均不在 TurboQuant 作用范围内。即便在推理阶段,KV Cache在单卡 HBM 占用中的占比亦相对有限;以 400B 以上参数规模模型为例,权重体量通常达数百 GB,且多为不可压缩数据,并非 TurboQuant 所能处理。与此同时,CPU 侧 DRAM 主要承担数据预处理、调度与系统运行,与KV Cache 关联有限。我们认为,在推理内存需求持续提升及云厂商资本开支具备长期确定性的背景下,HBM 与 DRAM 的结构性需求仍具韧性。 TurboQuant 对 NAND 的影响传导相对复杂,但仍偏向正向 我们认为,TurboQuant 对 NAND 的影响相对复杂,但整体结论同样偏正向。我们认为,TurboQuant 通过压缩 KV Cache 降低内存占用,使单卡资源在长上下文推理中更为充足,从而减少 KV 在 GPU 与外部存储之间的 swap频率,边际降低 NAND 访问强度,或对短期需求节奏产生轻微扰动。但随着上下文长度持续扩展,且未来向千万级 Token 应用演进,该扰动有望被新一代应用需求所对冲。我们认为,企业级 SSD 需求的核心仍在模型运行状态存储、训练数据加载及 AI 服务器日志等环节,与 KV Cache 机制并无直接关联。即便缓存效率提升,上述需求亦不会发生实质变化。因此,我们认为,TurboQuant 仅对个别场景节奏略有扰动,难改 NAND 整体需求结构。 TurboQuant 能力与约束并存,通用性仍待验证 我们认为,TurboQuant 更偏特定场景优化,适用于超长上下文推理,尚不足以形成通用内存压缩范式。首先,我们认为,极坐标与高斯投影将引入额外计算开销,在长上下文场景下具备收益,但在短上下文且对时延敏感的场景中反而可能增加推理时延。其次,我们认为,当前 GPU 尚未针对相关算子进行原生优化,PolarQuant 与 QJL 主要依赖自定义 CUDA Kernel 实现,张量核心利用率有限,短期内难以实现充分适配。此外,我们认为,该方法主要作用于 attention score computation,但在新架构如 linear attention 和state-space models 中尚未得到验证。最后,尽管 TurboQuant 在谷歌的学术评测中显示精度无损,但我们认为,在精度要求较高的低频推理场景中,QJL 引入的随机噪声或无法完全消除,存在事前难以量化的精度损失风险。 风险提示:技术落地缓慢、需求不及预期等。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 科技 风险提示 技术落地缓慢:AI 技术推进和产品落地可能达不到预期,或影响行业营收及利润。 需求不及预期:市场的存储芯片需求规模可能不及预期,影响行业营收及利润。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 科技 免责声明 分析师声明 本人,何翩翩,兹证明本报告所表达的观点准确地反映了分析师对标的证券或发行人的个人意见;彼以往、现在或未来并无就其研究报告所提供的具体建议或所表迖的意见直接或间接收取任何报酬。请注意,标*的人员并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。 一般声明及披露 本报告由华泰证券股份有限公司或其关联机构制作,华泰证券股份有限公司和其关联机构统称为“华泰证券”(华泰证券股份有限公司已具备中国证监会批准的证券投资咨询业务资格) 。本报告所载资料是仅供接收人的严格保密资料。本报告仅供华泰证券及其客户和其关联机构使用。华泰证券不因接收人收到本报告而视其为客户。 本报告基于华泰证券认为可靠的、已公开的信息编制,但华泰证券对该等信息的准确性及完整性不作任何保证。 本报告所载的意见、评估及预测仅反映报告发布当日的观点和判断。在不同时期,华泰证券可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。以往表现并不能指引未来,未来回报并不能得到保证,并存在损失本金的可能。华泰证券不保证本报告所含信息保持在最新状态。华泰证券对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 华泰证券(华泰证

立即下载
综合
2026-03-29
华泰证券
5页
0.95M
收藏
分享

[华泰证券]:科技行业动态点评:TurboQuant,存储板块的“DeepSeek”时刻?,点击即可下载。报告格式为PDF,大小0.95M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
不同循环方式液氧甲烷火箭发动机最高室压及比冲
综合
2026-03-29
来源:中小盘行业点评-液氧甲烷:定义商业航天的“未来燃料”
查看原文
不同推进剂发动机性能对比
综合
2026-03-29
来源:中小盘行业点评-液氧甲烷:定义商业航天的“未来燃料”
查看原文
“天鹊”(TQ-12)80 吨液氧甲烷发动机
综合
2026-03-29
来源:中小盘行业点评-液氧甲烷:定义商业航天的“未来燃料”
查看原文
我国火箭发射费用50%为火箭制造费用
综合
2026-03-29
来源:商业航天行业系列深度二:商业航天,新“大航海”时代,开启万亿征程
查看原文
【太空光伏设备】远期市场空间有望累计达1000亿元
综合
2026-03-29
来源:商业航天行业系列深度二:商业航天,新“大航海”时代,开启万亿征程
查看原文
2020-2025年中国卫星行业总收入预测趋势图
综合
2026-03-29
来源:商业航天行业系列深度二:商业航天,新“大航海”时代,开启万亿征程
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起