DeepSeek原理与效应
深度解读DeepSeek:原理与效应天津大学自然语言处理实验室The Natural Language Processing Laboratory at Tianjin University熊德意 天津大学dyxiong@tju.edu.cnhttps://dyxiong.github.iohttps://tjunlp-lab.github.io伏羲传语大语言模型发展路线图0102DeepSeek V2-V3/R1技术原理03DeepSeek效应04未来展望报告目录生成式AI:2014 —— 2024AGI … ASIENIAC1945达特茅斯会议1956图灵测试1950ELIZA196620142024生成式AIAttention2014Transformer2017Scaling Laws | GPT-32020RLHF | ChatGPT2022o1/R12024AI寒冬I1974-1980专家系统1980-1987AI寒冬II1987-1990s生成式AI:使用生成式模型生成各类数据(语言、语音、图片、视频等)o Attention:数据依存关系建模o Transformer:数据生成的统一架构o Scaling Laws:数据学习、生成的扩展法则o RLHF:生成与人类价值对齐的数据o o1/R1:生成式求解问题——生成问题求解的过程和答案(推理)统计方法1990-2000sNN再兴起2006-生成式AI:2014 —— 2024AGI … ASIENIAC1945达特茅斯会议1956图灵测试1950ELIZA196620142024生成式AIAttention2014Transformer2017Scaling Laws | GPT-32020RLHF | ChatGPT2022o1/R12024AI寒冬I1974-1980专家系统1980-1987AI寒冬II1987-1990s生成式AI:使用生成式模型生成各类数据(语言、语音、图片、视频等)o Attention:数据依存关系建模o Transformer:数据生成的统一架构o Scaling Laws:数据学习、生成的扩展法则o RLHF:生成与人类价值对齐的数据o o1/R1:生成式求解问题——生成复杂问题的答案(推理)统计方法1990-2000sNN再兴起2006-生成式AI:2014 —— 2024AGI … ASIENIAC1945达特茅斯会议1956图灵测试1950ELIZA196620142024生成式AIAttention2014Transformer2017Scaling Laws | GPT-32020RLHF | ChatGPT2022o1/R12024AI寒冬I1974-1980专家系统1980-1987AI寒冬II1987-1990s生成式AI:使用生成式模型生成各类数据(语言、语音、图片、视频等)o Attention:数据依存关系建模o Transformer:数据生成的统一架构o Scaling Laws:数据学习、生成的扩展法则o RLHF:生成与人类价值对齐的数据o o1/R1:生成式求解问题——生成复杂问题的答案(推理)统计方法1990-2000sNN再兴起2006-生成式AI:2014 —— 2024AGI … ASIENIAC1945达特茅斯会议1956图灵测试1950ELIZA196620142024生成式AIAttention2014Transformer2017Scaling Laws | GPT-32020RLHF | ChatGPT2022o1/R12024AI寒冬I1974-1980专家系统1980-1987AI寒冬II1987-1990s生成式AI:使用生成式模型生成各类数据(语言、语音、图片、视频等)o Attention:数据依存关系建模o Transformer:数据生成的统一架构o Scaling Laws:数据学习、生成的扩展法则o RLHF:生成与人类价值对齐的数据o o1/R1:生成式求解问题——生成复杂问题的答案(推理)统计方法1990-2000sNN再兴起2006-生成式AI:2014 —— 2024AGI … ASIENIAC1945达特茅斯会议1956图灵测试1950ELIZA196620142024生成式AIAttention2014Transformer2017Scaling Laws | GPT-32020RLHF | ChatGPT2022o1/R12024AI寒冬I1974-1980专家系统1980-1987AI寒冬II1987-1990s生成式AI:使用生成式模型生成各类数据(语言、语音、图片、视频等)o Attention:数据依存关系建模o Transformer:数据生成的统一架构o Scaling Laws:数据学习、生成的扩展法则o RLHF:生成与人类价值对齐的数据o o1/R1:生成式求解问题——生成复杂问题的答案(推理)统计方法1990-2000sNN再兴起2006-自然语言处理与语言模型自然语言处理:人类语言的智能化处理与分析,使计算机具备听、说、读、写、译等人所具备的语言能力语言模型:自然语言统计建模,简单说,就是预测句子中的下一个单词是什么大语言模型:2018 —— 2024Zhao et al. A Survey of Large Language Models. arXiv:2303.18223大语言模型:技术栈算力管理数据处理和管理通用模型行业模型资源分配负载均衡任务调度性能监控弹性扩展容错机制质量筛选预训练数据内容过滤数据去重语言检测领域分类版本控制General-purpose M odelData Processing and M anag em entCom puting M anag em ent硬件软件H 100A100M I350M I300910B910A数据分类网页代码书籍论文百科处理流程对齐训练数据评测数据价值对齐知识能力安全可信专业领域Prom ptResponsesACBD>>>模型评测预训练对齐训练SFTD PORLH FBest of N sam plingD ata ParallelPipeline ParallelSequence ParallelExpert ParallelZeROFlashAttentionTensor Parallel动态批处理模型量化模型剪枝模型蒸馏算子优化模型部署性能监控模型训练Specialized M odel应用层自主规划工具调用信息检索智能客服图文创作代码生成A pplication通用模型行业模型领域微调训练领域对齐训练行业模型部署行业模型评测行业数据行业对齐数据数据处理预训练后训练应用部署▪数据治理▪数据要素▪知识源头▪基座模型▪自监督学习▪能力涌现▪对齐模型▪微调&强化▪安全可信▪红队测试▪商业落地▪模型压缩o 训练范式• 预训练 —— 基座模型• 后训练 —— 对齐模型• 推理训练 —— 推理模型o 关键• 模型架构• 训练算法• 扩展法则大语言模型:生命周期与范式杀手锏:性能/成本 曲线 | 性价比扩展法则Sasha Ru
[天津大学]:DeepSeek原理与效应,点击即可下载。报告格式为PDF,大小8.1M,页数44页,欢迎下载。