电子行业LPU专题报告一:架构创新突破大模型推理延迟瓶颈,广阔市场空间有望快速放量
请阅读最后一页的重要声明! LPU 专题报告一:架构创新突破大模型推理延迟瓶颈,广阔市场空间有望快速放量 电子 证券研究报告 行业专题报告 / 2026.03.15 投资评级:看好(维持) 最近 12 月市场表现 分析师 唐佳 SAC 证书编号:S0160525110002 tangjia@ctsec.com 联系人 周勃宇 zhouby@ctsec.com 相关报告 1. 《光刻胶加速突围,高端国产化迎关键窗口》 2026-03-12 2. 《国产模型调用量激增,昇腾适配部署加速》 2026-03-04 3. 《看好 2026 年 AI 产业端云并进大趋势》 2026-02-25 核心观点 ❖ LPU 为新一代面向大模型推理阶段的芯片,核心为 TSP 架构:LPU是专为顺序处理的计算密集型任务设计的新型芯片架构,核心在于 TSP 架构,包含五大功能模块,将经典的处理器五级流水线拆散在整个芯片内,进而消除了硬件的复杂性,使指令执行顺序和时间具有确定性。在 TSP 架构下,编译器可以直接访问并精确控制芯片的底层硬件状态,实现了软件定义硬件。 ❖ LPU 可缩短大模型推理过程中的延迟,提高用户体验感:大模型在推理过程中会存在延迟,延迟与用户体验感精密挂钩,大模型推理过程中的延迟主要在 Decode 阶段,核心瓶颈在于内存带宽。LPU 具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于 LPU 的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。 ❖ LPU 具备广阔的潜在发展空间,已步入量产初期:目前 Tokens 的消耗量大幅增长,2024 年初我国日均 Token 的消耗量为 1000 亿,2026 年 2 月主流大模型合计日均 Token 消耗已到 180 万亿级别,Tokens 消耗量快速增长,带动推理芯片市场规模的高增长。LPU 可降低大模型推理的延迟,我们认为 LPU 有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。目前LPU 已步入量产初期,放量在即。 ❖ 投资建议:我们认为 LPU 受益于低推理延时的优异表现,有望实现快速渗透,我们看好 LPU 的高成长性及 LPU 以机柜出货时带来的 PCB 机会,建议关注:智微智能(参股元川微)、星宸科技(多轮增资元川微)、沪电股份(英伟达 PCB 供应商)、胜宏科技(英伟达 PCB 供应商)、深南电路。 ❖ 风险提示:AI 技术迭代不及预期的风险;大模型发展不及预期的风险;LPU行业发展不及预期的风险 表 1:重点公司投资评级 代码 公司 总市值(亿元) 收盘价(03.13) EPS(元) PE 投资评级 2024A 2025E 2026E 2024A 2025E 2026E 001339 *智微智能 184.73 73.24 0.50 0.87 1.37 146.48 84.18 53.46 - 301536 星宸科技 311.99 73.98 0.61 0.66 1.03 121.75 111.42 71.89 增持 002463 沪电股份 1,562.20 81.18 1.34 2.03 2.69 60.38 40.07 30.20 增持 300476 胜宏科技 2,421.57 278.23 1.32 1.62 0.00 210.30 171.50 0.00 增持 002916 深南电路 1,668.38 250.23 2.76 0.00 8.84 90.78 0.00 28.31 增持 数据来源:wind 数据,iFinD 数据,财通证券研究所,“*采用 iFinD 一致预期” -20%-6%9%23%38%52%电子沪深300 谨请参阅尾页重要声明及财通证券股票和行业评级标准 2 行业专题报告/证券研究报告 内容目录 1 LPU 面向大模型推理阶段,TSP 架构为核心 ............................................................... 4 1.1 LPU 是一款用于大模型推理阶段的定制芯片 ............................................................ 4 1.2 LPU 核心在于 TSP 架构,指令执行顺序和时间具有确定性 ........................................ 5 1.3 软件定义硬件,编译器定义芯片行为 ...................................................................... 8 1.4 单节点内 Fullmesh 拓扑,单机柜内 Dragonfly 拓扑 ................................................. 9 2 LPU 可缩短大模型推理过程中的延迟,提高用户体验感 ................................................ 11 2.1 大模型推理延迟与用户使用体验感紧密挂钩,延迟主要发生在 Decode 阶段 ................. 11 2.1.1 大模型推理过程分为 Prefill 和 Decoding 两个阶段 ............................................... 11 2.1.2 延迟/吞吐/利用率为衡量大模型推理性能的指标,延迟与用户使用体验感紧密挂钩 ....... 13 2.1.3 大模型推理过程中的延迟主要在 Decode 阶段,核心瓶颈在于内存带宽 .................... 15 2.2 LPU 具备更快的内存带宽,可缩短大模型推理过程中的延迟 ...................................... 15 2.2.1 LPU 采用 SRAM 作为存储介质,解决大模型推理阶段面临的内存带宽受限问题 ......... 15 2.2.2 基于 LPU 的大模型具有更快的推理速度和更具性价比的价格 .................................. 16 3 LPU 具备广阔潜在发展空间,已步入量产初期 ............................................................18 3.1 Tokens 消耗量大幅增长带动推理芯片市场规模高增长,LPU 具备广阔潜在发展空间 .....18 3.2 海外已进入量产初期,国内已推出 LPU 产品 ..........................................................18 4 投资建议 ............................................................................................................. 20 5 风险提示
[财通证券]:电子行业LPU专题报告一:架构创新突破大模型推理延迟瓶颈,广阔市场空间有望快速放量,点击即可下载。报告格式为PDF,大小2.15M,页数22页,欢迎下载。



