计算机行业AI算力“卖水人”专题系列(2)-芯片散热:从风冷到液冷,AI驱动产业革新
芯片散热:从风冷到液冷,AI驱动产业革新 ——AI算力“卖水人”专题系列(2)评级:推荐(维持)证券研究报告2024年06月25日计算机刘熹(证券分析师)S0350523040001liux10@ghzq.com.cn请务必阅读报告附注中的风险提示和免责声明2相对沪深300表现表现1M3M12M计算机-6.3%-21.5%-40.4%沪深300-3.5%-1.9%-10.0%最近一年走势相关报告《电力IT系列专题(1):能源转型+电改深化,电力IT迎新机遇(推荐)*计算机*刘熹》——2024-06-23《计算机事件点评:英伟达COMPUTEX 2024:下一代AI平台Rubin将推出,拥抱AI+机器人时代(推荐)*计算机*刘熹》——2024-06-04《计算机行业点评报告:政策密集落地,电力IT建设有望加速(推荐)*计算机*刘熹》——2024-05-31-43%-33%-23%-13%-4%6%2023/06…2023/09…2023/12…2024/03…2024/06…计算机沪深300请务必阅读报告附注中的风险提示和免责声明3u核心要点:AI算力发展与政策PUE等驱动下,芯片级散热将从热管/VC转向更高效的3DVC与液冷,芯片级散热有望打开成长空间。u一、芯片散热概览:功耗升级、散热技术持续革新电子设备发热的本质原因就是工作能量转化为热能的过程。散热是为解决高性能计算设备中的热管理问题而设计的,它们通过直接在芯片或处理器表面移除热量来优化设备性能并延长使用寿命。随着芯片功耗的提升,散热技术从一维热管的线式均温,到二维VC的平面均温,发展到三维的一体式均温,即3D VC技术路径,最后发展到液冷技术。u二、主要散热技术:从风冷到液冷,冷板到浸没式散热技术包括风冷与液冷两类。风冷技术中,热管与VC的散热能力较低,3D VC散热上限扩至1000W,均需搭配风扇进行散热,技术简单、便宜,适用于大多数设备。液冷技术具备更高散热效率,包括冷板式与浸没式两类,其中冷板式为间接冷却,初始投资中等,运维成本较低,相对成熟,英伟达GB200 NVL72采用冷板式液冷解决方案;浸没式为直接冷却,技术要求较高,运营维护成本较高,曙光数创研发“1拖2”双相浸没液冷结构。u 三、性能+TCO多重驱动,散热市场规模持续向上AI大模型训推对芯片算力提出更高要求,提升单芯片功耗。芯片温度影响性能,当芯片工作温度近70-80℃ 时,温度每升高2℃,芯片性能会降低约10%,故单芯片功耗增长进一步提升散热需求。此外,英伟达B200功耗超1000W、接近风冷散热上限;“双碳”+东数西算等政策严格数据中心PUE要求,液冷平均PUE低于风冷;TCO方面,相比风冷,冷板液冷的初始投资成本接近风冷,并且后续运行成本更低。据Precedence,预期2024-2026年全球AI芯片市场规模CAGR为29.72%,2024年预期全球交换机市场规模同比+5%左右。随着芯片及服务器、交换机的市场规模扩大,且芯片功耗增长提高散热要求,我们认为芯片级散热市场规模增速有望提升。请务必阅读报告附注中的风险提示和免责声明4u 投资建议:AI算力发展与政策PUE等驱动下,芯片级散热将从热管/VC转向更高效的3DVC与冷板,芯片级散热有望打开成长空间、迎量价齐升。相关公司1)芯片散热:曙光数创、飞荣达、中航光电、立讯精密、中石科技、思泉新材;2)数据中心散热:英维克、高澜股份、申菱环境、佳力图、朗威股份、依米康、同飞股份、川润股份、润泽科技、科华数据、网宿科技;3)服务器整机:浪潮信息、中科曙光、工业富联、华勤技术、紫光股份、中兴通讯、软通动力、神州数码、烽火通信、中国长城等。u 风险提示:下游行业需求复苏不及预期、AI大模型发展不及预期、技术发展不及预期、原材料价格波动风险、市场竞争加剧、汇率波动风险等。请务必阅读报告附注中的风险提示和免责声明5一、芯片散热概览功耗升级、散热技术持续革新请务必阅读报告附注中的风险提示和免责声明6● 电子设备发热的本质原因就是工作能量转化为热能的过程。芯片作为电子设备的核心部件,其基本工作原理是将电信号转化为各种功能信号,实现数据处理、存储和传输等功能。而芯片在完成这些功能的过程中,会产生大量热量,这是因为电子信号的传输会伴随电阻、电容、电感等能量损耗,这些损耗会被转化为热能。● 温度过高会影响电子设备工作性能,甚至导致电子设备损坏。据《电子芯片散热技术的研究现状及发展前景》,如对于稳定持续工作的电子芯片,最高温度不能超过85 ℃,温度过高会导致芯片损坏。● 散热技术需要持续升级,来控制电子设备的运行温度。芯片性能持续发展,这提升了芯片功耗,也对散热技术提出了更高的要求。此外,AI大模型的训练与推理需求,要求AI芯片的单卡算力提升,有望进一步打开先进散热技术的成长空间。图:芯片的温度云图变化资料来源:CSDN,各公司官网,国海证券研究所图:CPU\GPU\Switch IC的TDP逐渐提升CPU型号发布时间TDPIntelIce Lake2021Q2105W-270WSapphire Rapids2023115W-350WEmerald Rapids2023150W-385WGranite Rapids2024500WAMDRome2019120W-280WMilan2021120W-280WGenoa2022200W-360WGPU型号发布时间TDPNVIDIAA1002020250W-400WH100 SXMH100 PCIe2023300W-350Wup to 700WAMDMI1002020up to 300WMI2002021300WMI3002023600W请务必阅读报告附注中的风险提示和免责声明7● 散热是为解决高性能计算设备中的热管理问题而设计的,它们通过直接在芯片或处理器表面移除热量来优化设备性能并延长使用寿命。● 随着芯片功耗的提升,从一维热管的线式均温,到二维VC的平面均温,发展到三维的一体式均温,即3D VC技术路径,最后发展到液冷技术。图:芯片级别产业链热管风扇导热垫片(TIM)铝/铜冲压散热器 / 散热模组 / 散热导管NB / PCAI 产品通讯产品服务器上游 - 主要原料中游下游 - 产品应用冷板模组图:热管、VC、3DVC 散热技术情况资料来源:双鸿公告,飞荣达官网,国海证券研究所请务必阅读报告附注中的风险提示和免责声明8资料来源:uanalyze,国海证券研究所● 热管与VC的散热能力较低,3D VC风冷散热上限扩大至1000W,冷板式具备1000W+的广阔散热范围。请务必阅读报告附注中的风险提示和免责声明9● 根据ODCC《冷板液冷服务器设计白皮书》,综合考量初始投资成本、可维护性、PUE 效果以及产业成熟度等因素,冷板式和单相浸没式相较其他液冷技术更有优势,是当前业界的主流解决方案。表:服务器散热技术对比情况液冷方案非接触式液冷接触式液冷冷板式浸没式液冷相变浸没式单相浸没式投资成本初始投资中等初始投资及运维成本高初始投资及运维成本高运维成本低PUE1.1-1.2<1.05<1.09可维护性较简单复杂供应商华为、浪潮曙光、联想超聚变等主流供
[国海证券]:计算机行业AI算力“卖水人”专题系列(2)-芯片散热:从风冷到液冷,AI驱动产业革新,点击即可下载。报告格式为PDF,大小5.29M,页数54页,欢迎下载。
