搜索

热门搜索：

2025年DeepSeek原理与教育场景应用报告-北京大学

DeepSeek内部研讨系列------------DeepSeek 原理与教育场景应用AI肖睿团队2025年4月18日成都• 北大青鸟人工智能研究院• 北大计算机学院• 北大教育学院学习科学实验室目录1.DeepSeek现象和背后原因2.现代人工智能原理和发展3.DeepSeek的应用01DeepSeek和AI认知1.AI赋能教育的全景图2.教学环节的应用场景与案例3.AI通识教育方案02AI在教育场景的落地使用3页现象：DeepSeek快速出圈◼ 2024年12月26日，DeepSeek推出对标OpenAI GPT-4o的语言模型DeepSeek V3，随后在美国AI行业内部引起轰动。◼ 2025年1月20日，DeepSeek发布对标OpenAI o1的语言模型DeepSeek R1，并于1月24日引起美国投资界KOL关注。◼ 2025年1月26日，关于DeepSeek颠覆了大模型的商业模式（堆算力、拼资本），引发英伟达股价大跌，DeepSeek首先在美国出圈，引发社会讨论。◼ 春节前后，DeepSeek在中国出圈，并上升到中美竞争高度，同时纷纷接入DeepSeek，DeepSeek成为AI和大模型的代名词。◼ DeepSeek让AI跨越了鸿沟。学习交流可以加AI肖睿团队微信号(ABZ2180)4页◆产品优势（用户可感受到）1. 思考过程展示2. 中文好有情商3. 容易获得，使用简单4. 联网和来源引用5. 速度快6. 免费DeepSeek产品出圈？全民硬控DeepSeek学习交流可以加AI肖睿团队微信号(ABZ2180)5页◆ DeepSeek公司于2023年5月成立北京公司，2023年7月成立杭州公司，是幻方量化孵化出的一家大模型研究机构，160人的团队分布在中国杭州和北京，是中国AI2.0（大模型）时代的七小龙之一。•注：AI1.0（深度学习）时代的四小龙：商汤、旷世、云从、依图◆ 除了DeepSeek公司之外，其它六家也被投资界称为中国大模型企业六小虎（智谱AI、百川智能、月之暗面、阶跃星辰、MiniMax、零一万物）。到底谁是DeepSeek？公司、模型、产品学习交流可以加AI肖睿团队微信号(ABZ2180)到底谁是DeepSeek？公司、模型、产品IaaS硬件服务（设备/电脑/服务器/GPU、网络、操作系统）AI系统的部署方案（公有云、私有云、本地化）PaaS平台服务（存储、计算、数据、安全、中间件）MaaS模型服务（数据工程、推理加速、训练框架、API调用）SaaS应用服务（网页、APP、桌面软件、设备软件）AI系统的技术实现➢私有化部署✓本地：个人设备或电脑、企业服务器✓数据中心（IDC）：企业服务器、服务器集群（私有云）➢公有云服务：阿里云、火山云、腾讯云、金山云、华为云等；AWS、Azure等➢开源模型：DeepSeek、Qwen、Llama、SD、微调模型等•向上提供：私有化部署，公有云服务（DeepSeek官网、硅基流动、火山引擎等）➢闭源模型：OpenAI、Claude、百度等•向上提供：公有云服务➢生产办公系统：目前多数为定制开发（RAG、LangChain、Agent等）➢对话机器人：目前多数为标准产品，使用云服务•免费：DeepSeek、豆包、Kimi、元宝、Monica、秘塔搜索、问小白、Molly R1等•收费（月费；充值）：文心一言、通义千问、Liblib、ChatGPT等6页学习交流可以加AI肖睿团队微信号(ABZ2180)到底谁是DeepSeek？公司、模型、产品ModelBase ModelDeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B蒸馏模型，能力稍弱➢实际上是增加了推理能力的Qwen模型和Llama模型，不能称为DeepSeek模型➢市场上有误解，厂商有误导，Ollama工具的模型选项中也有误导DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7BDeepSeek-R1-Distill-Llama-8BLlama-3.1-8BDeepSeek-R1-Distill-Qwen-14BQwen2.5-14BDeepSeek-R1-Distill-Qwen-32BQwen2.5-32BDeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-InstructDeepSeek-R1-671BDeepSeek-V3-Base满血版，能力最强7页学习交流可以加AI肖睿团队微信号(ABZ2180)1.模型能力：通常来说，参数量越大，模型就有更强的理解和生成能力，但是需要更多计算资源。2.硬件需求：参数越多，对内存（RAM）和显存（VRAM）的需求就越高。3.运行速度：参数量大的模型，推理速度更慢，尤其是资源不足的时候。参数量影响模型能力1.本地部署DeepSeek时，需根据硬件配置选择合适模型版本。如1.5B模型适合资源受限设备，671B模型需服务器集群支持。2.合理匹配参数量与硬件，可优化模型性能，提升运行效率，避免资源浪费或性能瓶颈。参数量与硬件配置匹配模型参数量意义蒸馏模型-概念模型蒸馏的定义➢ 通俗解释：模型蒸馏就像是让一个“老师”（大模型）把知识传授给一个“学生”（小模型），让“学生”变成“学霸”。➢ 正式定义：模型蒸馏是一种将大型复杂模型（教师模型）的知识迁移到小型高效模型（学生模型）的技术。模型蒸馏的原理➢ 教师模型的训练：先训练一个性能强大但计算成本高的教师模型。➢ 生成软标签：教师模型对数据进行预测，得到每个样本的概率分布，这些就是软标签。➢ 训练学生模型：用软标签和硬标签共同训练学生模型。➢ 优化与调整：通过调整超参数，优化学生模型的性能。蒸馏技术的优势➢ 模型压缩：学生模型参数少，计算成本低，更适合在资源受限的环境中部署。➢ 性能提升：学生模型通过学习教师模型的输出概率分布，能够更好地理解数据的模式和特征。➢ 效率提高：学生模型训练所需的样本数量可能更少，训练成本降低。DeepSeek的模型优势能力突破开源、低成本、国产自主DeepSeek以“推理能力+第一梯队性能”为核心基础，叠加：开源开放、超低成本、国产自主研发三大优势，不仅实现技术代际跨越，更推动AI技术普惠化与国产化生态繁荣，成为全球大模型赛道的重要领跑者。核心加分项：开源、低成本、国产自主1. 开源：技术共享，生态共建• 全量开源训练代码、数据清洗工具及微调框架• 开发者可快速构建教育、金融、医疗等垂直领域应用，推动协同创新。2. 低成本：普惠企业级AI应用• 针对H系列芯片做了大量的模型架构优化和系统工程优化。• 最后一次训练成本仅$557w ：显著低于行业同类模型，打破高价壁垒。• 推理成本降低83%：千亿参数模型适配中小企业需求，加速商业化落地。3. 国产自主：技术自主，缩短差距• 将国产模型与美国的代际差距从1-2年缩短至3-5个月，突破“卡脖子”技术瓶颈。• 构建多行业专属模型矩阵，全面支持国内产业智能化升级。基础能力：进入推理模型阶段，并跻身全球第一梯队• 推理能力跃升：DeepSeek大模型核心技术突破，实现复杂推理任务的精准处理与高效执行，覆盖多模

立即下载

信息科技

2025-05-08

135页

16.45M

2025年DeepSeek原理与教育场景应用报告-北京大学，点击即可下载。报告格式为PDF，大小16.45M，页数135页，欢迎下载。

本报告共135页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共135页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

相关图表

图表 67. 可比公司估值对比表

信息科技

2025-05-08

来源：稀缺的C端生产力软件龙头，AI与海外双轴驱动

查看原文

图表 66.公司分业务盈利预测表

信息科技

2025-05-08

来源：稀缺的C端生产力软件龙头，AI与海外双轴驱动

查看原文

图表 65. 蜜蜂试卷已经成为苹果编辑推荐应用之一

信息科技

2025-05-08

来源：稀缺的C端生产力软件龙头，AI与海外双轴驱动

查看原文

图表 64. 公司智能文字识别技术和商业大数据技术对不同 B 端客户的赋能

信息科技

2025-05-08

来源：稀缺的C端生产力软件龙头，AI与海外双轴驱动

查看原文

图表 63. 部分海外地区新增付费转化率和付费用户渗透率低于国内

信息科技

2025-05-08

来源：稀缺的C端生产力软件龙头，AI与海外双轴驱动

查看原文

百万元）图表 62. 2021-2024 年公司在中国港澳台及海外地区的毛利率水平高于中国大陆

信息科技

2025-05-08

来源：稀缺的C端生产力软件龙头，AI与海外双轴驱动

查看原文

AI智能总结

本报告探讨了DeepSeek大模型在教育场景的应用及其技术优势，分析了其快速出圈的原因和对行业的深远影响。 1. DeepSeek凭借开源、低成本、国产自主三大优势迅速崛起，其模型性能跻身全球第一梯队，将中美技术差距缩短至3-5个月。 2. 技术层面，DeepSeek采用混合专家模型、多头潜在注意力机制等创新架构，通过FP8混合精度训练等技术大幅降低训练成本，推理成本降低83%。 3. 产品层面，DeepSeek以思考过程展示、中文情商高等特点获得用户青睐，其API定价仅为行业均价的1/10，推动AI技术普惠化。 4. 行业影响方面，DeepSeek打破了巨头垄断局面，促使行业从"唯规模论"转向注重性价比和高效能，加速了AI商业化落地。 5. 在教育领域，DeepSeek的技术突破为教学环节提供了创新应用场景，推动了AI通识教育的普及和发展。

2025年DeepSeek原理与教育场景应用报告-北京大学

关于我们

联系我们

2025年DeepSeek原理与教育场景应用报告-北京大学

关于我们

联系我们

小程序

公众号