电子-AI行业2026年中期策略：从LLM到Agent—电子产业链的再定价

华安证券研究所从LLM到Agent—电子产业链的再定价电子&AI行业2026年中期策略分析师：李美贤（S0010524020002）分析师：刘志来（S0010523120005）分析师：李元晨（S0010524070001）联系人：闫春旭（S0010125060002）证券研究报告2026年6月24日华安证券研究所华安研究• 拓展投资价值 2⚫Agent时代最突出的两大矛盾,一个是KV Cache，另一个是CPU的调度压力。这两者本质上都源于Agent区别于Chatbot的上下文特征——以庞大的System Prompt、大段的代码粘贴、多轮Loop和工具调用为主导因素。Harness的成熟，使得用户涌向 Claude Code、Codex为代表的codingagent，推动Anthropic 的ARR从约 90 亿美元一路跃升至约 470 亿美元，在软件史上几乎没有先例。•存储： Agent时代，KV Cache膨胀是最主要矛盾，存储通胀是长期性的。在真实的Agent负载中，上下文会从约12K token迅速膨胀到数百k百万级别的token，使需要存储的KV Cache急剧膨胀,成为推动存储需求乃至整个技术演进的最核心驱动力。因此，KV Cache offload成为当前最重要的方向。SK海力士预计全球存储芯片供应缺口也可能持续至2030年。本轮AI驱动的存储超级周期中，DRAM涨价尤为剧烈，使得将KV Cacheoffload到NAND的单位容量性价比不断凸显。再加上英伟达的CMX等方案逐步成熟，配合vLLM/LMCache等软件栈对分层存储的原生支持，KV Cache的offload有望迎来阶段性突破，NAND也有望承接比以往更多的KV Cache offload需求。•CPU：Agent时代，CPU面对长上下文压力变大，GPU:CPU比例从现有的8:1到1:1势在必行，CPU通胀也是长期性的。随着CPU增速预期不断上修，并且16通道CPU的陆续渗透以及对MRDIMM的全面支持，将使内存接口芯片搭上CPU增长的快车，有望迎来市场空间的高速爆发。•PCB：当前PCB产业链核心矛盾正从中游制造向上游材料端转移。中游虽经历大规模资本开支，但受制于mSAP等高端工艺良率爬坡缓慢及核心设备交期拉长，有效产能释放速度远低于算力需求斜率，拐点预计于2026年Q3伴随英伟达Rubin平台量产落地与高阶工艺突破而出现，2027年正交背板方案全面渗透及M9/M10级别材料规模化应用将进一步打开成长空间。相比之下，上游特种电子布、高端CCL等供给更具刚性，下游板厂为保障产能安全已提前锁定长单，供需矛盾率先激化，涨价逻辑清晰兑现，2026年下半年业绩爆发力与确定性领先。此外，超高多层压合量产、关键树脂/玻纤布国产替代及玻璃基板等从0到1方向亦值得重视。•AI PC：PC面临ARM生态重塑。在架构层面，ARM正在重塑PC终端：除了苹果依托强大的软硬件掌控力完成M系列生态向ARM迁移外，英伟达与联发科联合打造了专为本地AI智能体设计的“RTX Spark”处理器，集成6144个Blackwell GPU核心，在FP4下算力高达1 Petaflop。通过CUDA与微软Prism模拟器的双轮驱动，Windows on ARM生态的软件兼容性短板正被有效解决。•AI手机：智能手机进入Volume to Value 时代。面对2026年存储元器件价格倍增的BOM压力，手机厂商被迫提前囤货并削减低利润的低端中端机型，将核心资源转攻具备高溢价能力的AI高端机。智能手机将有望摆脱APP孤岛效应，AI OS将成为未来旗舰机型的核心卖点之一。硬件成本倒逼与AI溢价的双重作用，将加速推动全球智能手机产业结构的整体高端化与价值链上移。•风险提示：新技术迭代不及预期，原材料价格大幅波动，市场需求不及预期，市场竞争加剧，产能建设不及预期等。核心观点华安证券研究所华安研究• 拓展投资价值 3Agent时代：Anthropic 的ARR变化（2025H2 — 2026年6月）核心要点•核心驱动：Claude Code（2025.5 公开发布）企业级编程代理•2025H2开始快速增长:公司ARR从40亿→90亿，半年翻倍•2026Q1-Q2 加速：公司ARR从90亿→470亿,6个月增长5.2倍•Dario Amodei：增速超原计划 8 倍（预期 10x，实际 80x） ARR 预测•26年底：～750-900亿数据来源：Anthropic、Future Research、华安证券研究所华安证券研究所华安研究• 拓展投资价值 4LLM → Agent：数据中心被卡住的新瓶颈LLM 时代单次问答 · 短上下文 · 一次推理训练为主，推理偶发范式切换Agent 时代多步规划 · 长链工具调用 · 持续推理推理为主，时长可达数小时推理负载特征：从「短脉冲」转向「长时高强度」Token 消耗↑ 10-100×上下文长度↑ 百万级工具调用↑ 高频并发会话↑ 长驻数据中心四大瓶颈①CPU 重估Agent 编排、工具调用、CPU被重新定价②内存带宽 & 存储 I/OHBM 带宽制约长上下文 KV Cache；Agent 状态 / RAG 带来高频小文件读写③网络互联多卡多机协同推理对 NVLink / IB 带宽提出新要求④能耗散热单机柜功耗突破 100kW，传统风冷无法承载，被迫切液冷数据来源：华安证券研究所整理华安证券研究所华安研究• 拓展投资价值 5HBM显存预算分解：以B300为例288 GB物理 HBM · 十进制（厂商标注）268 GiB二进制 · 实际可寻址241 GiB× 0.90 利用率 = 可用预算GB ≠ GiB厂商按十进制标 288 GB（288×10⁹ B）；框架按二进制计 GiB → 288×10⁹ ÷ 2³⁰ ≈ 268 GiB。再乘 gpu_memory_utilization = 0.90 预留 10% 安全余量。组成显存 (GiB)占可用预算说明模型权重 weights20.888.7%DeepSeek-V4-Flash 权重分片（量化后每卡占用）峰值激活 peak act.7.713.2%前向计算时中间激活的峰值显存非 PyTorch 占用显存1.140.5%NCCL、CUDA Context、通信缓冲等KV Cache pool211.287.7%扣除以上后的剩余，决定可容纳 token 数可用预算合计240.92100%267.69 GiB × 0.90 利用率可用预算 240.92 GiB 的构成（按占比）KV Cache pool 211.2 GiB · 87.7%权重数据来源：华安证券研究所测算华安证券研究所华安研究• 拓展投资价值 6标题8卡服务器可承载多少的总用户跑推理？以B300跑Deepseek V4 Flash为例① 显存大小 —— 决定「同时并发上限」≈ 5M token8卡B300提供的 KV Cache池 ≈1683GB ÷1M token单用户用满上下文情况下=5 个并发用户上限② 时间维度 —— 决定「可容纳总用户数」5 个并发用户上限×80%利用率×60s ÷ 7s请求间隔 ÷ 延

立即下载

信息科技

2026-06-25

华安证券

29页

2.57M

[华安证券]:电子-AI行业2026年中期策略：从LLM到Agent—电子产业链的再定价，点击即可下载。报告格式为PDF，大小2.57M，页数29页，欢迎下载。

本报告共29页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共29页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

电子-AI行业2026年中期策略：从LLM到Agent—电子产业链的再定价

关于我们

联系我们

电子-AI行业2026年中期策略：从LLM到Agent—电子产业链的再定价

关于我们

联系我们

小程序

公众号