计算机行业专题研究:国产大模型“凭”什么降价?

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 计算机 国产大模型“凭”什么降价? 华泰研究 计算机 增持 (维持) 研究员 谢春生 SAC No. S0570519080006 SFC No. BQZ938 xiechunsheng@htsc.com +(86) 21 2987 2036 联系人 袁泽世,PhD SAC No. S0570122080053 yuanzeshi@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 重点推荐 股票名称 股票代码 目标价 (当地币种) 投资评级 浪潮信息 000977 CH 50.67 买入 金山办公 688111 CH 354.50 买入 福昕软件 688095 CH 73.96 买入 泛微网络 603039 CH 41.97 买入 资料来源:华泰研究预测 2024 年 6 月 10 日│中国内地 专题研究 国产模型厂商进入 API“价格战”,利好 AI 应用开发 2024 年 5 月 6 日,DeepSeek 发布最新 MoE 模型 DeepSeek-V2(32K 上下文),刷新了模型 API 定价:输入¥1 元/M tokens、输出¥2 元/M tokens。紧接着,智谱、阿里、百度、腾讯、讯飞等厂商均宣布旗下模型 API 降价,部分降价幅度高达 100%。我们深入拆解了各家 API 产品矩阵,发现降价的主要是轻量级模型,对于高并发 B 端用户或影响不大。我们从定性逻辑和定量技术两个维度分析降价的原因。我们认为,API 降价将吸引更多的 ISV 开发 AI 相关应用,有望提高 Super App 出现概率,建议关注算力和应用相关公司,包括浪潮信息、金山办公、福昕软件、泛微网络等。 降价以入门级轻量 API 为主,可以从技术优化和生态抢占来解释 降价厂商中,智谱、百度和讯飞主要降价产品为轻量版;阿里和腾讯则将旗下全部模型进行降价,降价幅度不等。字节为首次定价,价格较低。可以看出,降价幅度和范围较大的主要是互联网企业,其资源更加丰富。分析降价原因,一方面,DeepSeek V2 证明了,确实可以通过注意力机制优化,大大减少所需缓存的量,降低成本和提高效率。另一方面,即使没有技术上的降价逻辑,通过降价手段吸引开发者,目前看仍是抢占生态的重要手段。 从技术层面降低模型推理成本,核心在于优化 KV cache 目前,大模型的长文本支持能力已成为趋势。在推理长文本时,需要首先将文本预填充到 GPU 的 HBM 中,然后再解码出 token。其中预填充速度主要受 GPU计算能力影响,解码速度受 HBM 带宽影响。当文本很长时,KV cache将占用 HBM 相当大的空间,导致用户并发性下降,且解码耗时更长。用户并发性下降,还将带来新的问题,即需要从 HBM 上“卸载”暂时不用的 KV cache,再“加载”下一个用户的 KV cache,带来新的耗时。因此,降低KV cache 是优化关键。 典型优化方法:压缩 KV cache,或采用全局 KV cache 我们研究了近期 DeepSeek V2 和微软的 YOCO 典型的 KV cache 压缩方法,代表两种流派。DeepSeek V2 引入多头隐注意力(MLA)机制,不再缓存全部的 KV,而是用隐向量来压缩 KV,与 Transformer 原始的多头注意力相比,KV cache 可以减少 90%以上。微软的 YOCO 则将 Decoder 架构一切为二,下半部分负责用高效的注意力机制产生全局 KV cache,上半部分则直接使用全局 KV cache,不再需要额外计算,也大大降低了缓存量。 模型降价有望利好算力和应用,建议关注相关产业链公司 我们认为,模型降价将吸引更多的开发者开发 AI 应用,或进一步提振算力需求,提升 Super App 出现概率,建议关注:1)AI 服务器:浪潮信息等;2)AI 应用:金山办公、福昕软件、泛微网络等。其他产业链相关公司:1)海外算力产业链:光模块(中际旭创、天孚通信、新易盛)、AI 服务器(工业富联)等;2)国产算力产业链:海光信息、寒武纪、神州数码等。 风险提示:宏观经济波动,技术进步不及预期。 (45)(32)(19)(5)8Jun-23Oct-23Feb-24Jun-24(%)计算机沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 计算机 正文目录 拆解大模型推理过程,洞察国产模型降价本质 ............................................................................................................. 3 表现:国产厂商进入 API“价格战”阶段 .................................................................................................................. 3 趋势:长上下文已经成为全球模型的共性发展特点 .............................................................................................. 7 拆解:当我们使用长上下文时,模型究竟发生了什么? ....................................................................................... 7 从幻方和微软进展看 KV cache 压缩的典型算法 ....................................................................................................... 12 幻方 DeepSeek V2:优化注意力机制来大幅压缩 KV cache .............................................................................. 12 微软 YOCO:通过全局缓存方式来大幅压缩 KV cache ...................................................................................... 14 KV cache 压缩技术可复制,模型边际调用成本或接近 0 .................................................................................... 16 AI Agent 或是提高应用表现的下一个关键 ............................................

立即下载
电子设备
2024-06-10
华泰证券
21页
4.35M
收藏
分享

[华泰证券]:计算机行业专题研究:国产大模型“凭”什么降价?,点击即可下载。报告格式为PDF,大小4.35M,页数21页,欢迎下载。

本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共21页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
国内碳纤维行业单位毛利 图 46:国内碳纤维行业毛利率
电子设备
2024-06-10
来源:建筑材料行业周观点:玻纤延续去库提价趋势,看好药玻高景气度
查看原文
丙烯腈市场价格走势 图 44:国内碳纤维行业单位成本
电子设备
2024-06-10
来源:建筑材料行业周观点:玻纤延续去库提价趋势,看好药玻高景气度
查看原文
碳纤维月度出口总量及金额走势 图 42:碳纤维月度出口均价走势
电子设备
2024-06-10
来源:建筑材料行业周观点:玻纤延续去库提价趋势,看好药玻高景气度
查看原文
国内碳纤维工厂库存走势 图 38:国内碳纤维月度表观消费量和实际消费量走势
电子设备
2024-06-10
来源:建筑材料行业周观点:玻纤延续去库提价趋势,看好药玻高景气度
查看原文
碳纤维月度进口总量及金额走势 图 36:碳纤维月度进口均价走势
电子设备
2024-06-10
来源:建筑材料行业周观点:玻纤延续去库提价趋势,看好药玻高景气度
查看原文
国内碳纤维月度产量及开工率 图 34:国内碳纤维总产能及企业有效产能(吨)
电子设备
2024-06-10
来源:建筑材料行业周观点:玻纤延续去库提价趋势,看好药玻高景气度
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起