通信周跟踪:Stargate和DeepSeek,大模型创新和工程优化的双向奔赴

请务必阅读最后股票评级说明和免责声明1通信周跟踪(20250120-20250124)领先大市-A(维持)Stargate 和 DeepSeek,大模型创新和工程优化的双向奔赴2025 年 2 月 5 日行业研究/行业周报通信行业近一年市场表现资料来源:最闻相关报告:【山证通信】山西证券通信行业周跟踪:英伟达铜光共进趋势明朗,BIS新政或不影响国内算力建设 2025.1.21【山证通信】CES 中国品牌参展数创新高,AI 端侧应用百花齐放-周跟踪(20250106-20250112) 2025.1.16分析师:高宇洋执业登记编码:S0760523050002邮箱:gaoyuyang@sxzq.com张天执业登记编码:S0760523120001邮箱:zhangtian@sxzq.com研究助理:孙悦文邮箱:sunyuewen@sxzq.com投资要点行业动向:美国宣布“星际之门”超算计划,Meta 也计划提升 2025 年资本开支。据新华社报道,美国总统特朗普 21 日宣布,将由软银集团、OpenAI、中东主权基金MGX 以及 Oracle 公司成立合资公司计划 4 年内投资 5000 亿美金建设“星际之门”超算中心。“星际之门”初始投资为 1000 亿美金,据 Altman 透露,OpenAI、软银、甲骨文&MGX 首期将分别注资 190 亿、190 亿、70 亿,剩余资金或由 LP 投资人或债务融资解决。另一方面,1 月 24 日据 Meta CEO 扎克伯格在 Facebook上表示,Meta 今年将投资 600 至 650 亿美金用于 AI 相关资本开支,这一数字远高于彭博社此前预计 513 亿美元的资本开支。扎克伯格表示,META 正在建设一个超过 2GW 的数据中心,计划在 2025 年上线 1GW,并在年底前拥有超过 130万 GPU。我们认为,海外 AI 和 CSP 巨头纷纷上调资本开支表明了美国政界和产业界一致希望扩大算力领先优势以巩固美国在 AI 颠覆下的全球新秩序下的领导地位。目前,AI 算力投资的需求空前旺盛,这一方面来自各种 agent 智能体应用层出不穷,“AI 员工”真正渗透千行百业,另一方面来自各大云巨头害怕踏空的“AI 军备竞赛”逻辑,推理和训练双重驱动北美 2025 投资再创新高,将有效增强投资者的信心维持板块估值坚挺。国内 DeepSeekv3 惊艳创新,低成本实现全球领先推理大模型训练。另一方面,国内深度求索公司旗下的 DeepSeekv3 近期震撼发布,根据其技术报告分析,DeepSeekv3是一个拥有6710 亿参数的 MoE混合专家模型并且每个token 只有 370亿参数被激活。DeepSeekv3 在 2048 个 H800 集群上只花了总共 279 万 H800 GPUHours(按照 2 美金/GPU Hour 约 558 万美金成本)完成训练,相当于成本较同等规模的 Llama3 节省了约 10 倍算力,而最终实现的效果根据海外评测各项均超越了迄今为止所有开源模型。DeepSeekv3 惊艳亮相的背后是我国 AI 工作者在算力资源有限下对系统架构和算法的极致创新,比如多头潜注意力(MLA)机制、混合专家模型(MoE)的改进以及多令牌预测。其中 MLA 利用低秩压缩和潜向量,大幅减少了长序列模型推理(尤其 CoT)对 KV 缓存的需求;MoE 利用无辅助损失的负载均衡和共享专家机制攻克了路由崩溃难题;多令牌预测能够实现一次前向传递,预测多个 token 同时提高了训练和推理效率。此外,RL 阶段基于规则的奖励模型和机遇模型的奖励模型;SFT 阶段采用基于 DeepSeekR1 生产的高质量推理数据;以及数据处理方面的最小化数据冗余 FP8 低精度训练等均显著降低了算力需求。算力北美之“大”与国内之“精”为何能实现双向奔赴?首先,北美模型创行业研究/行业周报请务必阅读最后股票评级说明和免责声明2新与国内工程优化的定位不同,目前在预训练、后训练、思维链等大模型的理论创新多由 openAI 等北美巨头发起,这一数据的处理和中间的探索过程天然需要更大算力(如 DeepSeekv3 的技术报告指出,558 万美元训练成本是正式训练成本,不包括前期研究和架构算力数据的前期破冰研究)。其次,在国内算力芯片供给受限的背景下大模型优化的前提更侧重于“用”,成本的下降反而有利于应用的铺开和国产算力的配套,未来国内算力投资的迫切感增强。最后,基于北美 AI巨头将更加倾向于增加投资以扩大领先优势并实现某种超越阈值的算力“护城河”。我们认为无论是哪种发展路线,最终都会走向全球 AI 投资共热加速的态势。投资建议:我们看好北美 AI 算力链业绩释放并建议关注技术创新的机会,建议关注 AI infra 光纤布线、电源母排、液冷,IT 设备服务器、光模块、电源、DCI 以及 GB300 创新相关的超级电容、GPU Socket、1.6T 等。我们也持续看好国产算力投资增加叠加自主可控的双重贝塔,建议关注 ASIC 芯片、国产 HBM、国产超节点交换芯片、高密度背板连接器、AEC 铜连接,AI 物联网等配套机会。市场整体:本周(2025.01.20-2025.01.24)市场整体上涨,申万通信+5.24%,创业板指数+2.64%,深证成指+1.29%,科创板指数+0.92%,沪深 300 +0.54%,上证综指+0.33%。细分板块中,周涨幅最高的前三板块为液冷(+15.8%)、光缆海缆(+14.2%)、IDC(+13.1%)。从个股情况看,广和通、长飞光纤、博创科技、网宿科技、瑞可达领先,涨幅分别为+48.27%、+27.58%、+24.36%、+20.06%、+18.72%。中国卫星、高澜股份、中国电信、中国移动、中国联通居后,分别-1.84%、-0.50%、-0.43%、-0.07%、+0.21%。风险提示:海外算力需求不及预期,国内运营商和互联网投资不及预期,外部制裁升级。行业研究/行业周报请务必阅读最后股票评级说明和免责声明3目录1. 周观点和投资建议........................................................................................................................................................... 51.1 事件和观点................................................................................................................................................................. 51.2 建议关注.........................................................................................................................

立即下载
信息科技
2025-02-05
山西证券
张天,高宇洋,孙悦文
17页
1.35M
收藏
分享

[山西证券]:通信周跟踪:Stargate和DeepSeek,大模型创新和工程优化的双向奔赴,点击即可下载。报告格式为PDF,大小1.35M,页数17页,欢迎下载。

本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图 10
信息科技
2025-02-05
来源:医疗技术行业报告的脉搏2024:在一个不断复杂的环境,如何医疗技术适应茁壮成长?
查看原文
图 6美国和欧洲早期 VC 回合超过 500 万美元
信息科技
2025-02-05
来源:医疗技术行业报告的脉搏2024:在一个不断复杂的环境,如何医疗技术适应茁壮成长?
查看原文
图 5
信息科技
2025-02-05
来源:医疗技术行业报告的脉搏2024:在一个不断复杂的环境,如何医疗技术适应茁壮成长?
查看原文
图 4按年在美国和欧洲筹集的资本(百万美元)
信息科技
2025-02-05
来源:医疗技术行业报告的脉搏2024:在一个不断复杂的环境,如何医疗技术适应茁壮成长?
查看原文
图 3相对于领先指数的美国和欧洲 MedTech 市值
信息科技
2025-02-05
来源:医疗技术行业报告的脉搏2024:在一个不断复杂的环境,如何医疗技术适应茁壮成长?
查看原文
图 10
信息科技
2025-02-05
来源:医疗技术行业报告的脉搏2024:在一个不断复杂的环境,如何医疗技术适应茁壮成长?
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起