科技行业专题研究:英伟达吸收Groq定义AI下半场!

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 科技 英伟达吸收 Groq 定义 AI 下半场! 华泰研究 科技 增持 (维持) 何翩翩 研究员 SAC No. S0570523020002 SFC No. ASI353 purdyho@htsc.com +(852) 3658 6000 重点推荐 股票名称 股票代码 目标价 (当地币种) 投资评级 英伟达(NVIDIA) NVDA US 280.00 买入 资料来源:华泰研究预测 2026 年 1 月 12 日│美国 专题研究 Groq 交易是英伟达迄今披露的最大一笔交易,规模明显高于其 2019 年以69 亿美元收购 Mellanox。我们认为,Groq 所掌握的低时延推理核心 IP 在战略层面的重要性,已与当年 Mellanox 的互连与网络技术处于同一量级。该交易进一步凸显英伟达对确定性、Batch Size = 1 推理的前瞻性布局,契合行业向 Agentic AI 演进的整体趋势。通过将 Groq 的确定性“反射式引擎”深度整合至 CUDA 与 GPU 技术栈,英伟达正加速推动 Agentic 经济走向主流,并在其已确立优势的 AI“上半场”基础上,逐步奠定低时延为核心特征的“下半场”的技术与规则框架。 Acqui-hire 模式锁定 Groq 的 LPU 人才与核心 IP 英伟达对价约 200 亿美元获得 Groq 推理技术的授权、收购部分知识产权,并引入 Groq 核心工程团队,包括创始人兼 CEO Jonathan Ross(原 TPU架构师)与总裁 Sunny Madra。此次交易价格较 Groq 25 年 9 月最新私募融资估值的 69 亿美元隐含接近 3 倍溢价。从交易结构看,本次交易为 IP 授权叠加人才收购(Acqui-hire)的组合,而非完整的公司并购。GroqCloud云服务将作为独立公司继续运营,由原 CFO Simon Edwards 出任 CEO。我们认为,这种“精准打击式”的交易结构,使英伟达能够在获取关键低时延推理 IP 的同时,有效规避整合硬件竞争对手带来的并购与监管不确定性。 英伟达以收购 Groq 定义 AI“下半场”规则 我们认为,该交易反映英伟达对 Agentic AI 时代需求结构变化的判断,即时延正成为继算力之后的关键约束因素。据 CNBC 报道,英伟达 CEO 黄仁勋在内部邮件中指出,此次交易的核心目标在于将 Groq 的低时延技术整合进英伟达的 AI 工厂。在此基础上,英伟达通过引入面向 Agentic AI 的低时延加速器,开始主动定义 AI“下半场”的技术标准。在 2025 年被普遍视为Physical AI 元年之后,我们认为 2026 年有望成为 Agentic AI 元年,其核心特征在于,AI 工作负载将从以吞吐量为导向的训练阶段,转向为对时延高度敏感、执行过程具备确定性的实时应用阶段。我们认为,英伟达将把握这一关键时间节点,通过收购 Groq 为 Agentic 应用的规模化落地提供关键支撑,通过整合专用推理 IP 与其 CUDA 和 GPU 技术体系,英伟达得以在训练与实时推理两种核心范式下同时建立领先能力,并在一定程度上削弱云厂商依托自研芯片、从推理侧切入竞赛的潜在空间。 从 TPU 到 Dojo 与 Groq,计算架构趋同下的战略分化 我们认为,Groq、Tesla Dojo 以及谷歌 TPU 在底层均继承张量加速器的共同技术基因,但三者围绕 AI 工作负载的不同侧重点差异化设计。尽管 Dojo与 Groq 同样依赖大规模片上 SRAM 与紧耦合的 Scale-up 互连,Tesla 选择将这一架构优势主要投向大规模、高吞吐的 FSD 训练场景,而非更适合发挥其低时延潜力的 Batch Size = 1 推理场景。相比之下,谷歌 TPU 虽起源于 Jonathan Ross 主导的“以推理为先”的设计理念,但其路线已演进为以 HBM 与 OCS 为核心的 Pod 级吞吐引擎,用于支撑大模型训练与推理。在体系结构上,TPU 与 Groq 的 Mega-Chip 理念存在呼应,但面向批处理的范式不同。 我们认为,Groq 或延续并强化“推理优先”的设计理念,通过确定性调度与片上 SRAM 带宽的协同优化,重点覆盖 Agentic 时代的低时延、交互式推理场景,并形成对科技巨头自研加速器的差异化优势。 风险提示:技术落地缓慢、需求不及预期等。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 科技 正文目录 问题 1:Groq 是什么?其架构在 AI 发展中有何战略意义? ................................................................................. 3 问题 2:Groq 架构如何区别于 GPU 范式,从而实现确定性的时延优势? .......................................................... 3 问题 3:Groq 的存储配置、互连(Scale-Up 与 Scale-Out)及软件架构如何支撑低时延推理?其设计选择在结构层面与英伟达 GPU 有何差异? ......................................................................................................................... 6 问题 4:Groq 架构的主要结构性约束与经济性限制是什么? ............................................................................... 8 问题 5:哪些市场细分能够支撑 Groq 的前期资本投入?为何“时延敏感型推理”正在从小众需求变为主流? ..... 10 问题 6:如何理解英伟达 25 年 12 月收购 Groq 的战略动因? ........................................................................... 11 问题 7:Groq 的 LPU 与英伟达 GPU 如何在训练与推理环节形成互补,共同支撑 Agentic AI 时代? ............... 12 问题 8:Groq 与 Tesla Dojo 在定位、架构与存储配置上有何差异?其战略结果为何出现分化? ...................... 14 问题 9:Groq 与谷歌最新一代 TPU v7 如何对比?Jonathan Ross 的设计理念如何从 TPU v1 演进至 LPU?.. 16 问题 10:并入英伟达体系后,Groq“下一代”芯片将呈现哪些特征? ...........................................

立即下载
综合
2026-01-12
华泰证券
25页
3.53M
收藏
分享

[华泰证券]:科技行业专题研究:英伟达吸收Groq定义AI下半场!,点击即可下载。报告格式为PDF,大小3.53M,页数25页,欢迎下载。

本报告共25页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共25页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
当前股价下,可比公司 2025 年市盈率均值 90.4X
综合
2026-01-12
来源:北交所首次覆盖报告:超精密制造小巨人,半导体+液冷服务器领域新业务共拓空间
查看原文
计划首次授予股票期权的行权考核年度为 2025-2026 年两个会计年度
综合
2026-01-12
来源:北交所首次覆盖报告:超精密制造小巨人,半导体+液冷服务器领域新业务共拓空间
查看原文
激励计划首次授予的激励对象共计 63 人
综合
2026-01-12
来源:北交所首次覆盖报告:超精密制造小巨人,半导体+液冷服务器领域新业务共拓空间
查看原文
公司重视研发,研发费用整体呈现增长趋势(万元)
综合
2026-01-12
来源:北交所首次覆盖报告:超精密制造小巨人,半导体+液冷服务器领域新业务共拓空间
查看原文
公司成本管控良好,三大费用率整体稳定
综合
2026-01-12
来源:北交所首次覆盖报告:超精密制造小巨人,半导体+液冷服务器领域新业务共拓空间
查看原文
科学仪器及医疗器械为主要收入来源(万元) 图23:半导体+交通零部件领域营收占比逐步增长
综合
2026-01-12
来源:北交所首次覆盖报告:超精密制造小巨人,半导体+液冷服务器领域新业务共拓空间
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起