计算机行业:比较试用DeepSeek看模型走向应用的新迹象

识别风险,发现价值 请务必阅读末页的免责声明 1 / 37 [Table_Page] 深度分析|计算机 证券研究报告 [Table_Title] 计算机行业 比较试用 DeepSeek 看模型走向应用的新迹象 [Table_Summary] 核心观点:  DeepSeek-V3 上线,模型性能提升较快。2024 年 12 月,幻方旗下深度求索公司上线 DeepSeek-V3 系列模型首个版本,较前代模型DeepSeek-V2.5 有显著提升。为了深入探索该模型的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi 以及通义千问大模型生成的结果进行比较。  通过有限的实测结果,我们发现,DeepSeek 总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek 是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek 给出的代码注释、算法原理解释以及开发流程的指引最为全面。在文本生成和数学计算能力方面,DeepSeek 并未展现出明显优于其他大模型之处。  DeepSeek-V3 通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模 MoE 模型的训练中,DeepSeek-V3 采用了高效的负载均衡策略、FP8 混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化 MoE 专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。证明了模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。  DeepSeek-V3 算力成本降低的原因有两点。第一,DeepSeek-V3 采用的 DeepSeekMoE 是通过参考了各类训练方法后优化得到的,避开了行业内 AI 大模型训练过程中的各类问题。第二,DeepSeek-V3 采用的 MLA 架构可以降低推理过程中的 kv 缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。  算力依然是推动大模型发展的核心驱动力。DeepSeek-V3 通过技术创新和资源优化,大幅降低了成本,展现了算力的高效性。在该技术路线得到充分验证后,有望驱动相关 AI 应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。  以大规模通用模型为基础,聚焦特定领域突出自身特点的模型应用开发或许是下一阶段的商业化探索方向。DeepSeek-V3 为未来大模型技术的发展提供了重要启发,未来或将从依赖大规模通用模型转向发展一些更具特色、成本更低、更适合具体应用场景的模型,随着这些特色模型的不断成熟,AI 商业化的边际成本有望降低,应用前景更为广阔。  风险提示:AI 大模型技术追赶和竞争加剧的风险。由于下游生态和使用环境的差异,商业化成功有不确定性。AI 生成内容存在知识版权纠纷的风险。 [Table_Grade] 行业评级 买入 前次评级 买入 报告日期 2024-12-29 [Table_PicQuote] 相对市场表现 [Table_Author] 分析师: 刘雪峰 SAC 执证号:S0260514030002 SFC CE No. BNX004 021-38003675 gfliuxuefeng@gf.com.cn 分析师: 周源 SAC 执证号:S0260523040001 0755-23948351 shzhouyuan@gf.com.cn 请注意,周源并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。 [Table_DocReport] 相关研究: 计算机行业:主题趋势轮动抢跑背景下的更多选择方向 2024-12-22 计算机行业:券商新一代核心交易系统招标打破僵局 2024-12-19 计算机行业:鸿蒙生态构建、代表性行业规模测算及推进节奏判断 2024-12-18 [Table_Contacts] 联系人: 戴亚敏 021-38003697 daiyamin@gf.com.cn -34%-22%-11%1%13%24%12/2302/2404/2406/2408/2410/24计算机沪深300 识别风险,发现价值 请务必阅读末页的免责声明 2 / 37 [Table_PageText] 深度分析|计算机 [Table_impcom] 重点公司估值和财务分析表 股票简称 股票代码 货币 最新 最近 评级 合理价值 EPS(元) PE(x) EV/EBITDA(x) ROE(%) 收盘价 报告日期 (元/股) 2024E 2025E 2024E 2025E 2024E 2025E 2024E 2025E 寒武纪-U 688256.SH CNY 652.10 2024/12/27 买入 671.98 -0.72 0.45 - 1449.11 - 683.98 -5.30 3.20 紫光股份 000938.SZ CNY 28.96 2024/10/31 买入 34.40 0.86 1.15 33.67 25.18 18.04 14.47 6.80 8.30 浪潮信息 000977.SZ CNY 53.43 2024/10/31 增持 53.08 1.77 2.21 30.19 24.18 22.19 18.41 12.90 13.90 金山办公 688111.SH CNY 304.16 2024/10/28 增持 308.61 3.42 4.13 88.94 73.65 79.98 66.52 13.40 13.90 第四范式 06682.HK HKD 54.40 2024/12/03 买入 47.20 -0.80 -0.21 - - - - -7.30 -2.00 万兴科技 300624.SZ CNY 67.60 2024/10/25 增持 71.09 0.46 0.56 146.96 120.71 80.18 67.72 6.50 7.20 星环科技-U 688031.SH CNY 47.52 2024/04/26 买入 86.85 -1.44 0.20 - 237.60 - - -13.50 1.90 数据来源:Wind、广发证券发展研究中心 备注:表中估值指标按照最新收盘价计算 识别风险,发现价值 请务必阅读末页的免责声明 3 / 37 [Table_PageText] 深度分析|计算机 目录索引 一、DEEPSEEK-V3 上线,模型性能提升较快 .................................................................. 6 (一)沿用前代 MLA+MOE 架构,训练成本大幅降低

立即下载
电子设备
2025-01-10
广发证券
37页
4.93M
收藏
分享

[广发证券]:计算机行业:比较试用DeepSeek看模型走向应用的新迹象,点击即可下载。报告格式为PDF,大小4.93M,页数37页,欢迎下载。

本报告共37页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共37页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
重点公司估值表
电子设备
2025-01-10
来源:建筑材料行业“周期建材继往开来”系列一:水泥复盘,重视水泥“反内卷”与产能处置
查看原文
截至 12 月 27 日,已有 27 条产线落实产能处置
电子设备
2025-01-10
来源:建筑材料行业“周期建材继往开来”系列一:水泥复盘,重视水泥“反内卷”与产能处置
查看原文
三版水泥产能置换方案要点比较
电子设备
2025-01-10
来源:建筑材料行业“周期建材继往开来”系列一:水泥复盘,重视水泥“反内卷”与产能处置
查看原文
国常会多次强调落实“十四五”重点工程进度
电子设备
2025-01-10
来源:建筑材料行业“周期建材继往开来”系列一:水泥复盘,重视水泥“反内卷”与产能处置
查看原文
2024 年 11 月房地产销售面积与销售金额均有所改善(同比增速)
电子设备
2025-01-10
来源:建筑材料行业“周期建材继往开来”系列一:水泥复盘,重视水泥“反内卷”与产能处置
查看原文
此前产能置换使用的产能核定表
电子设备
2025-01-10
来源:建筑材料行业“周期建材继往开来”系列一:水泥复盘,重视水泥“反内卷”与产能处置
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起