电子-AI行业2026年中期策略:从LLM到Agent—电子产业链的再定价
华安证券研究所从LLM到Agent—电子产业链的再定价电子&AI行业2026年中期策略分析师:李美贤(S0010524020002)分析师:刘志来(S0010523120005)分析师:李元晨(S0010524070001)联系人:闫春旭(S0010125060002)证券研究报告2026年6月24日华安证券研究所华安研究• 拓展投资价值 2⚫Agent时代最突出的两大矛盾,一个是KV Cache,另一个是CPU的调度压力。这两者本质上都源于Agent区别于Chatbot的上下文特征——以庞大的System Prompt、大段的代码粘贴、多轮Loop和工具调用为主导因素。Harness的成熟,使得用户涌向 Claude Code、Codex为代表的codingagent,推动Anthropic 的ARR从约 90 亿美元一路跃升至约 470 亿美元,在软件史上几乎没有先例。•存储: Agent时代,KV Cache膨胀是最主要矛盾,存储通胀是长期性的。在真实的Agent负载中,上下文会从约12K token迅速膨胀到数百k百万级别的token,使需要存储的KV Cache急剧膨胀,成为推动存储需求乃至整个技术演进的最核心驱动力。因此,KV Cache offload成为当前最重要的方向。SK海力士预计全球存储芯片供应缺口也可能持续至2030年。本轮AI驱动的存储超级周期中,DRAM涨价尤为剧烈,使得将KV Cacheoffload到NAND的单位容量性价比不断凸显。再加上英伟达的CMX等方案逐步成熟,配合vLLM/LMCache等软件栈对分层存储的原生支持,KV Cache的offload有望迎来阶段性突破,NAND也有望承接比以往更多的KV Cache offload需求。•CPU:Agent时代,CPU面对长上下文压力变大,GPU:CPU比例从现有的8:1到1:1势在必行,CPU通胀也是长期性的。随着CPU增速预期不断上修,并且16通道CPU的陆续渗透以及对MRDIMM的全面支持,将使内存接口芯片搭上CPU增长的快车,有望迎来市场空间的高速爆发。•PCB:当前PCB产业链核心矛盾正从中游制造向上游材料端转移。中游虽经历大规模资本开支,但受制于mSAP等高端工艺良率爬坡缓慢及核心设备交期拉长,有效产能释放速度远低于算力需求斜率,拐点预计于2026年Q3伴随英伟达Rubin平台量产落地与高阶工艺突破而出现,2027年正交背板方案全面渗透及M9/M10级别材料规模化应用将进一步打开成长空间。相比之下,上游特种电子布、高端CCL等供给更具刚性,下游板厂为保障产能安全已提前锁定长单,供需矛盾率先激化,涨价逻辑清晰兑现,2026年下半年业绩爆发力与确定性领先。此外,超高多层压合量产、关键树脂/玻纤布国产替代及玻璃基板等从0到1方向亦值得重视。•AI PC:PC面临ARM生态重塑。在架构层面,ARM正在重塑PC终端:除了苹果依托强大的软硬件掌控力完成M系列生态向ARM迁移外,英伟达与联发科联合打造了专为本地AI智能体设计的“RTX Spark”处理器,集成6144个Blackwell GPU核心,在FP4下算力高达1 Petaflop。通过CUDA与微软Prism模拟器的双轮驱动,Windows on ARM生态的软件兼容性短板正被有效解决。•AI手机:智能手机进入Volume to Value 时代。 面对2026年存储元器件价格倍增的BOM压力,手机厂商被迫提前囤货并削减低利润的低端中端机型,将核心资源转攻具备高溢价能力的AI高端机。智能手机将有望摆脱APP孤岛效应,AI OS将成为未来旗舰机型的核心卖点之一。硬件成本倒逼与AI溢价的双重作用,将加速推动全球智能手机产业结构的整体高端化与价值链上移。•风险提示:新技术迭代不及预期,原材料价格大幅波动,市场需求不及预期,市场竞争加剧,产能建设不及预期等。核心观点华安证券研究所华安研究• 拓展投资价值 3Agent时代:Anthropic 的ARR变化(2025H2 — 2026年6月)核心要点•核心驱动:Claude Code(2025.5 公开发布)企业级编程代理•2025H2开始快速增长:公司ARR从40亿→90亿,半年翻倍•2026Q1-Q2 加速:公司ARR从90亿→470亿,6个月增长5.2倍•Dario Amodei:增速超原计划 8 倍(预期 10x,实际 80x) ARR 预测•26年底:~750-900亿数据来源:Anthropic、Future Research、华安证券研究所华安证券研究所华安研究• 拓展投资价值 4LLM → Agent:数据中心被卡住的新瓶颈LLM 时代单次问答 · 短上下文 · 一次推理训练为主,推理偶发范式切换Agent 时代多步规划 · 长链工具调用 · 持续推理推理为主,时长可达数小时推理负载特征:从「短脉冲」转向「长时高强度」Token 消耗↑ 10-100×上下文长度↑ 百万级工具调用↑ 高频并发会话↑ 长驻数据中心四大瓶颈①CPU 重估Agent 编排、工具调用、CPU被重新定价②内存带宽 & 存储 I/OHBM 带宽制约长上下文 KV Cache;Agent 状态 / RAG 带来高频小文件读写③网络互联多卡多机协同推理对 NVLink / IB 带宽提出新要求④能耗散热单机柜功耗突破 100kW,传统风冷无法承载,被迫切液冷数据来源:华安证券研究所整理华安证券研究所华安研究• 拓展投资价值 5HBM显存预算分解:以B300为例288 GB物理 HBM · 十进制(厂商标注)268 GiB二进制 · 实际可寻址241 GiB× 0.90 利用率 = 可用预算GB ≠ GiB厂商按十进制标 288 GB(288×10⁹ B);框架按二进制计 GiB → 288×10⁹ ÷ 2³⁰ ≈ 268 GiB。再乘 gpu_memory_utilization = 0.90 预留 10% 安全余量。组成显存 (GiB)占可用预算说明模型权重 weights20.888.7%DeepSeek-V4-Flash 权重分片(量化后每卡占用)峰值激活 peak act.7.713.2%前向计算时中间激活的峰值显存非 PyTorch 占用显存1.140.5%NCCL、CUDA Context、通信缓冲等KV Cache pool211.287.7%扣除以上后的剩余,决定可容纳 token 数可用预算合计240.92100%267.69 GiB × 0.90 利用率可用预算 240.92 GiB 的构成(按占比)KV Cache pool 211.2 GiB · 87.7%权重数据来源:华安证券研究所测算华安证券研究所华安研究• 拓展投资价值 6标题8卡服务器可承载多少的总用户跑推理?以B300跑Deepseek V4 Flash为例① 显存大小 —— 决定「同时并发上限」≈ 5M token8卡B300提供的 KV Cache池 ≈1683GB ÷1M token单用户用满上下文情况下=5 个并发用户上限② 时间维度 —— 决定「可容纳总用户数」5 个并发用户上限×80%利用率×60s ÷ 7s请求间隔 ÷ 延
[华安证券]:电子-AI行业2026年中期策略:从LLM到Agent—电子产业链的再定价,点击即可下载。报告格式为PDF,大小2.57M,页数29页,欢迎下载。



