2025DeepSeek技术全景解析：重塑全球AI生态的中国力量

2智研咨询YTEL_IGENCE RESEARC4 GROU.2025NAHR EPRDeepseek技术全景解析重塑全球A生态的中国力量编制：智研咨询www.chyxx.comCONTENT扫品行报告·专项定制·月度专顾·市场也位证明·专精特新中报·可研报告·商业计划书·产业视划三01DeepSeek企业背景02Deepseek模型家族目03Deepseek技术创新·04Deepseek商业模式录05Deepseek应用场景06AI大模型市场现状07Deepseek对Al行业影响总结www.chyxx.com2智研咨询柯品行研报告·专项定制·月度专题·市场池位证明·专精装新申报·可研报告·商业计划书·产业规划三INTELIGENCE RESEARC4 CROUPART01DeepSeek企业背景最全面的产业分析·可预见的行业趋势www.chyxx.com⚫·1.1DeepSeek基本情况deepseek己智研咨询DeepSeek背靠资金实力雄厚的幻方量化2025年1月，DeepSeek发布其最新开源模型DeepSeekRl，再度引发全球人工智能领域关注。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。DeepSeek背靠资金实力雄厚的幻方量化，DeepSeek创始人为梁文锋，文锋同时也是幻方量化的创始人：幻方量化是国内头部量化私募管理人，旗下有两家百亿量化私募，分别是2015年6月成立的浙江九章资产和2016年2月成立的宁波幻方量化。Deepseek公司简介DeepSeek股权结构宁波程恩企业管埋咨询合梁文锋伙企业（有限合傻}%661%北京杭州深度求索人工智能基础技术研究有限公司DeepSeek位于浙江杭州市：100%0.1%成立于2023年7月。北京深度求索人工智能基宁渡程采企业管理咨询合础技术研究有限公司伙企业（有限台伙)南沟戏品资料叉源：爱企ww.chyxx.com⚫deepseek.1.2Deepseek发展历程己智研咨询DeepSeek大模型不断优化送代回顾其发展历史，2024年1月，发布第一版大模型一一DeepSeekLLM，这个版本使用传统的Transformer架构，但在训练方面已经明显体现出DeepSeek团队通过不断优化训练策略，达到节约成本，提高效率的思想，这点也在后续的模型送代中被发扬光大，2024年5月，DeepSeek-v2发布，从这一代开始，DeepSeek模型开始使用混合专家（MoE）架构，这是传统Transformer月，DeepSeek-v3上线并开源，v3版本对MoE架构进行了进一步优化，在维持低训练成本的同时，稳定性与多方面性能表现都达到了与领先闭源模型相当的水平。2025年1月，DeepSeek-R1正式发布，R1模型的推理能力得到极大加强，与OpenAl-o1模型不相上下且推理过程完全透明，因此在全球范围备受关注。DeepSeek发展历程Deepseek模型家族正式发布咨询宣布开源第二推理模型DeepSeekRldeepseekDccpSeek代MoE大模型DeepSeekRlLite模型，并同步成立DeepSeekv2预览版正式上线开源模型权重DeepSeek Rl2023年了月2024年5月2024年11月2025年1月Deep5eek V3DeepSeek Coderv2DeepSeek VL2024年1月2024年9月2024年12月Deep5eek v2发布第一版大合并DeepSeekCoderv2宣布DeepSeekV3DeepSeekCoder模型和DeepSeekv2Chat两首个版本上线并同DeepSeekMathDeepSeek LLM个模型，升级推出全新的步开源模型权币DeepSeek LLMDeepseekv2.5新模型资料宋源：智研咨淘整理www.chyxx.com2智研咨询柯品行研报告·专项定制·月度专题·市场池位证明·专精装新申报·可研报告·商业计划书·产业规划三INTELIGENCE RESEARC4 CROUPART02Deepseek模型家族最全面的产业分析·可预见的行业趋势www.chyxx.comDeepSeek- V2⚫·2.1DeepSeek-v2模型deepseek己智研咨询DeepSeek-v2模型性能进一步优化以低成本的DeepSeek-v2，到超低价格的DeenSeek-v3：再到引l起世界广泛关注的DeepSeek-R1，DeenSeek的成功主要依赖于DeepSeek自身深厚的技术积累和持续的技术创新突破。DeepSeek-v2采用的是MoE架构，全参数量为236B，激活参数量是21B。其采用了两大创新技术：DeepSeekMoE架构和多头潜在注意力（MLA），使得DeepSeek-v2的训练成本大为降低并且提升推理速度。MLA通过将Kev-value缓存压缩为潜在向量来提高推理效率，从而提高吞吐量。DeepSeekMoE架构允许通过稀疏计算进行有效的推理。相比DeepSeekLLM67B（Dense）：DeepSeek-V2的性能更强，同时节省了42.5%的训练成本，减少了93.3%的KV缓存，最大生成吞吐量提高到5.76倍。DeepSeek-V2性能80DeepSeek-V2Training Costs (K GPU Hours/T Tokens)★Mixtral 8x22B.LLaMA370BDeepSeek 67BDBRXQwen1.572B Command R+DeepSek-V2saving 42.5% oftraining costsQwen1.532BDeepSeek 67B5010015020025000EGrok-170KV Cache for Generation (KB/Token)rformanceMixtral 8x7BLLaMA 2 70BDeepSeek 67BCommand R65LLaMA 3 8BDeepSeek-V2reduclng KV cache by 93.3% LLaMA 1 65BLLaMA 2 34BLLaMA 1 Family10020030040060Mistral 7BLLaMA 2 FamilyMaximumGenerationThroughput (Tokens/Sec)PLLaMA 3 FamilyMixtral FamilyDeepSeek 67BLLaMA 1 33B55Command R Family576% ofmaximumthroughput研咨询LLaMA 2 13BQwen1.5 FamilyZA-aadaad0204060801001000020000300004000050000ActivatedParameters (Billions)资料来源：DeepSeek、智研咨淘整理wwww.chyxx.com⚫⚫⚫⚫●2.2DeepSeek-v3模型deepseek2智研咨询DeepSeek-V3模型性能大幅提升DeepSeek-V3是一个强大的专家混合（MoE）语言模型，具有671B个总参数，激活

立即下载

信息科技

2025-03-07

北京智研科信咨询

51页

14.52M

[北京智研科信咨询]:2025DeepSeek技术全景解析：重塑全球AI生态的中国力量，点击即可下载。报告格式为PDF，大小14.52M，页数51页，欢迎下载。

本报告共51页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共51页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

2025DeepSeek技术全景解析：重塑全球AI生态的中国力量

关于我们

联系我们

2025DeepSeek技术全景解析：重塑全球AI生态的中国力量

关于我们

联系我们

小程序

公众号