电子行业TurboQuant之于存储详解(GenAI 系列之74):有理论启发的常规学术进展
请务必仔细阅读正文之后的各项信息披露与声明 行业及产业 行业研究/行业深度 证券研究报告 电子 2026 年 03 月 30 日 有理论启发的常规学术进展 看好 ——TurboQuant 之于存储详解(GenAI 系列之 74) 相关研究 - 证券分析师 刘洋 A0230513050006 liuyang2@swsresearch.com 杨海晏 A0230518070003 yanghy@swsresearch.com 袁航 A0230521100002 yuanhang@swsresearch.com 杨紫璇 A0230524070005 yangzx@swsresearch.com 研究支持 陈俊兆 A0230124100001 chenjz@swsresearch.com 联系人 刘洋 A0230513050006 liuyang2@swsresearch.com 本期投资提示: ⚫ 谷歌解决大模型 KV Cache 的论文热议,或引发存储需求的疑虑。近期谷歌论文《TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate》(2025年 4 月发表,ICLR 2026 年接收)和谷歌官网博客引发热议。 ⚫ 首先,我们找到原始论文,有较多新发现。1)新闻报道主要是参考了谷歌博客,参考原始论文偏少,而前者比后者激进。主要证据是 PolarQuant 内容、效果倍数、对照组的描述。2)若将 TurboQuant 的前序学术创新做一个追溯,即找到 QJL、RaBitQ、KIVI、两种版本 PolarQuant 的论文,会发现 TurboQuant 或只是“常规的学术进展”,与新闻描述的“DeepSeek 时刻”、“存储的重大变化”无关。3)假如 TurboQuant 真为“存储的重大变化”、“谷歌的 DeepSeek 时刻”,那么 2024-2025 年 RaBitQ、KIVI、PolarQuant 论文发布时,都曾是这种级别的突破。 ⚫ 其次,帮助一二级金融投资者理解 TurboQuant。1)大致包括 10 步骤论述。其中,第第 3 部分的粗略版,和第 6 部分的精细版,是本篇的一大特点。前者基于 MSE 均方误差生成最优失真率的矢量量化器,快速但有误差。后者提供 1 位量化器应用于残差,得到无偏且低失真的内积量化器。两者较为互补。2)人大等版本 PolarQuant 的思路,类似于逻辑分类索引资料;谷歌等版本 PolarQuant 的思路,类似于层级精简资料;KIVI算法,类似于分行业和个股索引资料;RaBitQ 算法,类似于二进制化归档资料(而二进制判断的内容,即各种特征标签,比如是否符合低 PE,是否符合成长股,是否符合某个政策)。本文的 TurboQuant 算法,可类比为:复用了索引、层级精简、校准员。 ⚫ 再次,TurboQuant 的利弊与比较。1)优点暂时不再赘述,折中了哪些呢?2)只压缩KV-Cache,未必压缩权重 weight,未必压缩模型本体,不改变激活值。3)应不改变训练,只改变推理,而且是中低端推理无效(比如端侧芯片无效)。4)场景适配性或有局限。5)一个关键问题,精度回退问题。未必是 2.5bit 与 16bit 来比(宣称的提效 6-8 倍或 4 倍),而是 2.5bit 和 4bit 比,效果或许并不明显。论文中的 KIVI 对照是证据。 ⚫ 最后,延展问题和这篇的启发。1)谷歌这篇虽未必影响存储的需求。但真正值得关注的是:同样是大模型(KV Cache)利好存储,但产业链不同环节的利益不统一,选取的方案差异化。2)AI 的本源,可以从数学和数字通信上思考。此前 KV Cache 的研究,主要以工程化为主,从信息论、数学极限推导都尚不充分。谷歌这篇从数字通信理论开始推导,是尝试努力创新的。正文列举了 Attention 注意力机制借鉴 DSP 理论。注意力机制,其实是 20 年前数字通信的优化思想(做各种数字滤波器)用在 AI 算法。 ⚫ 风险提示:前沿科技的研究,尤其学术论文的探索,一直伴随技术变化。而技术变化可能带来较大波动。尽管本文努力解释存储未必受到本篇论文影响,但此前存储领域涨幅较大,依然可能有交易风险。相关领域 P/E 倍数偏高,可能会有估值回归的风险。 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共19页 简单金融 成就梦想 1.正文与铺垫论文:或只是常规学术进展 ....................... 4 2.TurboQuant 论文梗概 ................................................. 6 2.1 论文梗概 ...................................................................................... 6 2.2 用比喻来帮助投资人理解 ............................................................ 8 3. 利弊与比较 ................................................................... 9 4. 延展问题:KV Cache+存储利益未必统一 ................... 10 5. 谷歌本篇学术贡献与启发 ............................................ 12 6. 风险提示 ..................................................................... 12 7. 附录 ............................................................................ 14 7.1 KIVI 相关论文要点 ..................................................................... 14 7.2 RaBitQ 相关论文要点 ................................................................ 15 7.3 TurboQuant 相关论文要点 ........
[申万宏源]:电子行业TurboQuant之于存储详解(GenAI 系列之74):有理论启发的常规学术进展,点击即可下载。报告格式为PDF,大小3.64M,页数19页,欢迎下载。



