2025年DeepSeek原理与教育场景应用报告-北京大学

DeepSeek内部研讨系列------------DeepSeek 原理与教育场景应用AI肖睿团队2025年4月18日成都• 北大青鸟人工智能研究院• 北大计算机学院• 北大教育学院学习科学实验室目录1.DeepSeek现象和背后原因2.现代人工智能原理和发展3.DeepSeek的应用01DeepSeek和AI认知1.AI赋能教育的全景图2.教学环节的应用场景与案例3.AI通识教育方案02AI在教育场景的落地使用3页现象:DeepSeek快速出圈◼ 2024年12月26日,DeepSeek推出对标OpenAI GPT-4o的语言模型DeepSeek V3,随后在美国AI行业内部引起轰动。◼ 2025年1月20日,DeepSeek发布对标OpenAI o1的语言模型DeepSeek R1,并于1月24日引起美国投资界KOL关注。◼ 2025年1月26日,关于DeepSeek颠覆了大模型的商业模式( 堆算力、拼资本),引发英伟达股价大跌,DeepSeek首先在美国出圈,引发社会讨论。◼ 春节前后,DeepSeek在中国出圈,并上升到中美竞争高度,同时纷纷接入DeepSeek,DeepSeek成为AI和大模型的代名词。◼ DeepSeek让AI跨越了鸿沟。学习交流可以加AI肖睿团队微信号(ABZ2180)4页◆产品优势(用户可感受到)1. 思考过程展示2. 中文好有情商3. 容易获得,使用简单4. 联网和来源引用5. 速度快6. 免费DeepSeek产品出圈?全民硬控DeepSeek学习交流可以加AI肖睿团队微信号(ABZ2180)5页◆ DeepSeek公司于2023年5月成立北京公司,2023年7月成立杭州公司,是幻方量化孵化出的一家大模型研究机构,160人的团队分布在中国杭州和北京,是中国AI2.0(大模型)时代的七小龙之一。•注:AI1.0(深度学习)时代的四小龙:商汤、旷世、云从、依图◆ 除了DeepSeek公司之外,其它六家也被投资界称为中国大模型企业六小虎(智谱AI、百川智能、月之暗面、阶跃星辰、MiniMax、零一万物)。到底谁是DeepSeek?公司、模型、产品学习交流可以加AI肖睿团队微信号(ABZ2180)到底谁是DeepSeek?公司、模型、产品IaaS硬件服务(设备/电脑/服务器/GPU、网络、操作系统)AI系统的部署方案(公有云、私有云、本地化)PaaS平台服务(存储、计算、数据、安全、中间件)MaaS模型服务(数据工程、推理加速、训练框架、API调用)SaaS应用服务(网页、APP、桌面软件、设备软件)AI系统的技术实现➢私有化部署✓本地:个人设备或电脑、企业服务器✓数据中心(IDC):企业服务器、服务器集群(私有云)➢公有云服务:阿里云、火山云、腾讯云、金山云、华为云等;AWS、Azure等➢开源模型:DeepSeek、Qwen、Llama、SD、微调模型等•向上提供:私有化部署,公有云服务(DeepSeek官网、硅基流动、火山引擎等)➢闭源模型:OpenAI、Claude、百度等•向上提供:公有云服务➢生产办公系统:目前多数为定制开发(RAG、LangChain、Agent等)➢对话机器人:目前多数为标准产品,使用云服务•免费:DeepSeek、豆包、Kimi、元宝、Monica、秘塔搜索、问小白、Molly R1等•收费(月费;充值):文心一言、通义千问、Liblib、ChatGPT等6页学习交流可以加AI肖睿团队微信号(ABZ2180)到底谁是DeepSeek?公司、模型、产品ModelBase ModelDeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B蒸馏模型,能力稍弱➢实际上是增加了推理能力的Qwen模型和Llama模型,不能称为DeepSeek模型➢市场上有误解,厂商有误导,Ollama工具的模型选项中也有误导DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7BDeepSeek-R1-Distill-Llama-8BLlama-3.1-8BDeepSeek-R1-Distill-Qwen-14BQwen2.5-14BDeepSeek-R1-Distill-Qwen-32BQwen2.5-32BDeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-InstructDeepSeek-R1-671BDeepSeek-V3-Base满血版,能力最强7页学习交流可以加AI肖睿团队微信号(ABZ2180)1.模型能力:通常来说,参数量越大,模型就有更强的理解和生成能力,但是需要更多计算资源。2.硬件需求:参数越多,对内存(RAM)和显存(VRAM)的需求就越高。3.运行速度:参数量大的模型,推理速度更慢,尤其是资源不足的时候。参数量影响模型能力1.本地部署DeepSeek时,需根据硬件配置选择合适模型版本。如1.5B模型适合资源受限设备,671B模型需服务器集群支持。2.合理匹配参数量与硬件,可优化模型性能,提升运行效率,避免资源浪费或性能瓶颈。参数量与硬件配置匹配模型参数量意义蒸馏模型-概念模型蒸馏的定义➢ 通俗解释:模型蒸馏就像是让一个“老师”(大模型)把知识传授给一个“学生”(小模型),让“学生”变成“学霸”。➢ 正式定义:模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术。模型蒸馏的原理➢ 教师模型的训练:先训练一个性能强大但计算成本高的教师模型。➢ 生成软标签:教师模型对数据进行预测,得到每个样本的概率分布,这些就是软标签。➢ 训练学生模型:用软标签和硬标签共同训练学生模型。➢ 优化与调整:通过调整超参数,优化学生模型的性能。蒸馏技术的优势➢ 模型压缩:学生模型参数少,计算成本低,更适合在资源受限的环境中部署。➢ 性能提升:学生模型通过学习教师模型的输出概率分布,能够更好地理解数据的模式和特征。➢ 效率提高:学生模型训练所需的样本数量可能更少,训练成本降低。DeepSeek的模型优势能力突破开源、低成本、国产自主DeepSeek以“推理能力+第一梯队性能”为核心基础,叠加:开源开放、超低成本、国产自主研发三大优势,不仅实现技术代际跨越,更推动AI技术普惠化与国产化生态繁荣,成为全球大模型赛道的重要领跑者。核心加分项:开源、低成本、国产自主1. 开源:技术共享,生态共建• 全量开源训练代码、数据清洗工具及微调框架• 开发者可快速构建教育、金融、医疗等垂直领域应用,推动协同创新。2. 低成本:普惠企业级AI应用• 针对H系列芯片做了大量的模型架构优化和系统工程优化。• 最后一次训练成本仅$557w :显著低于行业同类模型,打破高价壁垒。• 推理成本降低83%:千亿参数模型适配中小企业需求,加速商业化落地。3. 国产自主:技术自主,缩短差距• 将国产模型与美国的代际差距从1-2年缩短至3-5个月,突破“卡脖子”技术瓶颈。• 构建多行业专属模型矩阵,全面支持国内产业智能化升级。基础能力:进入推理模型阶段,并跻身全球第一梯队• 推理能力跃升:DeepSeek大模型核心技术突破,实现复杂推理任务的精准处理与高效执行,覆盖多模

立即下载
信息科技
2025-05-08
135页
16.45M
收藏
分享

2025年DeepSeek原理与教育场景应用报告-北京大学,点击即可下载。报告格式为PDF,大小16.45M,页数135页,欢迎下载。

本报告共135页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共135页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 67. 可比公司估值对比表
信息科技
2025-05-08
来源:稀缺的C端生产力软件龙头,AI与海外双轴驱动
查看原文
图表 66.公司分业务盈利预测表
信息科技
2025-05-08
来源:稀缺的C端生产力软件龙头,AI与海外双轴驱动
查看原文
图表 65. 蜜蜂试卷已经成为苹果编辑推荐应用之一
信息科技
2025-05-08
来源:稀缺的C端生产力软件龙头,AI与海外双轴驱动
查看原文
图表 64. 公司智能文字识别技术和商业大数据技术对不同 B 端客户的赋能
信息科技
2025-05-08
来源:稀缺的C端生产力软件龙头,AI与海外双轴驱动
查看原文
图表 63. 部分海外地区新增付费转化率和付费用户渗透率低于国内
信息科技
2025-05-08
来源:稀缺的C端生产力软件龙头,AI与海外双轴驱动
查看原文
百万元) 图表 62. 2021-2024 年公司在中国港澳台及海外地区的毛利率水平高于中国大陆
信息科技
2025-05-08
来源:稀缺的C端生产力软件龙头,AI与海外双轴驱动
查看原文
ai总结
AI智能总结
本报告探讨了DeepSeek大模型在教育场景的应用及其技术优势,分析了其快速出圈的原因和对行业的深远影响。 1. DeepSeek凭借开源、低成本、国产自主三大优势迅速崛起,其模型性能跻身全球第一梯队,将中美技术差距缩短至3-5个月。 2. 技术层面,DeepSeek采用混合专家模型、多头潜在注意力机制等创新架构,通过FP8混合精度训练等技术大幅降低训练成本,推理成本降低83%。 3. 产品层面,DeepSeek以思考过程展示、中文情商高等特点获得用户青睐,其API定价仅为行业均价的1/10,推动AI技术普惠化。 4. 行业影响方面,DeepSeek打破了巨头垄断局面,促使行业从"唯规模论"转向注重性价比和高效能,加速了AI商业化落地。 5. 在教育领域,DeepSeek的技术突破为教学环节提供了创新应用场景,推动了AI通识教育的普及和发展。
热门报告
加入社群
回顶部
报告群
公众号
小程序
在线客服
收起