DeepSeek内部研讨系列:DeepSeek与AIGC应用

DeepSeek内部研讨系列------------DeepSeek与AIGC应用AI肖睿团队(孙萍、周嵘、李娜、张惠军、刘誉)2025年2月20日• 北大青鸟人工智能研究院• 北大计算机学院元宇宙技术研究所• 北大教育学院学习科学实验室摘要1.本次讲座为DeepSeek原理和应用系列研讨的讲座之一,主要介绍DeepSeek的基本概念,以及大模型技术和AIGC工具应用,不需要大家具备专业的AI或IT技术背景。2.本次讲座首先分析当前备受瞩目的DeepSeek-R1 的概念、优势和历史地位。然后进一步探讨 大模型和AIGC的底层工作机制,旨在帮助读者突破工具应用的局限,理解DeepSeek和AIGC的深层次价值。最后,介绍如何科学选择与高效使用 AI 工具,为大家提供更具深度与实用性的应用场景的指导,给听众带来更落地的AI应用价值。3.尽管 DeepSeek-R1 以其低成本和开源策略为行业带来变革,但当前网络上的大量相关内容仅停留在工具应用层面,易对初级AI应用人员造成概念和思维方式的误导,这也是本次讲座希望解决的问题。3 01详解DeepSeek R1 02AIGC的概念和应用03 AIGC的能力揭秘04选择AIGC工具目 录详解DeepSeek-R1PART 01简介本部分介绍了DeepSeek-R1模型的技术特性、发展历程、应用场景及其在AIGC领域的定位。首先介绍人工智能的发展历程,以及大模型相关术语,并对比DeepSeek-R1与其他模型的性能表现。DeepSeek-R1以其低成本、开源策略和卓越的推理能力脱颖而出,尤其在复杂逻辑推理、数学和编程任务中表现优异。随后介绍DeepSeek公司的背景、市场定位以及DeepSeek-R1的技术原理和应用场景,揭示了其在推理密集型任务、教育、科研、知识应用和文档分析等领域的独特优势,并列举接入该模型的第三方应用。通过对人工智能发展历史以及DeepSeek-R1的介绍和分析,本部分旨在为听众提供一个对DeepSeek的客观、全面的认识,并理解该模型在AIGC领域的重要地位和应用潜力。人工智能发展历程2023年GPT-4AIGC的发展历程1950s-1990S1990s-2010S2010s-2022年大模型相关术语⚫ 多模态➢ 文本、图片、音频、视频⚫ AI工具(国内)➢ DeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索...⚫ 通用模型➢ 大语言模型(LLM,Large Language Model)➢ 视频模型➢ 多模态模型➢ ……⚫ 行业模型(垂直模型、垂类模型)➢ 教育、医疗、金融等大模型的关键发展生成模型ref:中文大模型基准测评2024年度报告(2025.01.08)推理模型生成模型与推理大模型的对比比较项GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位专注于通用自然语言处理和多模态能力,适合日常对话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。侧重于复杂推理与逻辑能力,擅长数学、编程和自然语言推理任务,适合高难度问题求解和专业领域应用,在中文表达上容易出彩。推理能力在日常语言任务中表现均衡,但在复杂逻辑推理(如数学题求解)上准确率较低。在复杂推理任务表现卓越,尤其擅长数学、代码推理任务,在部分基准测试(如 GPQA)中准确率高于 GPT-4o。多模态支持 支持文本、图像、音频乃至视频输入,可处理多种模态信息。当前主要支持文本输入,不具备图像处理等多模态能力。应用场景适合广泛通用任务,如对话、内容生成、多模态信息处理以及多种语言相互翻译和交流;面向大众市场和商业应用。适合需要高精度推理和逻辑分析的专业任务,如数学竞赛、编程问题和科学研究;在思路清晰度要求高的场景具有明显优势,比如采访大纲、方案梳理;在对中文语言表达和情感表达方面有明显优势。用户交互体验提供流畅的实时对话体验,支持多种输入模态;用户界面友好,适合大众使用。可展示大部分链式思考过程,便于专业用户理解推理过程;界面和使用体验具有较高的定制性,但整体交互节奏较慢。推理模型的优劣势优势劣势- 演绎或归纳等推理能力强(如谜题、数学证明)- 响应速度慢且计算成本高(需要更多推理时间)- 链式思维推理出色(善于分解多步骤问题)- 基于知识的任务更容易出错(容易产生幻觉)- 擅长复杂决策任务- 处理简单任务的时候效率低(容易"过度思考")- 可以呈现思考过程常见推理模型DeepSeek R1OpenAI o1OpenAI o3-miniGemini 2.0Grok3Kimi 1.5火爆全网的DeepSeek-R1爆火原因•DeepSeek-R1的推理能力进入了第一梯队(媲美OpenAI o1), 但训练和推理成本低、速度快、全部开源•DeepSeek打破了硅谷传统的“堆算力、拼资本”的大模型发展路径对AI行业的重大影响DeepSeek-R1以低成本和开源特性打破以往头部企业巨头割据局面DeepSeek-R1的API定价仅为行业均价的1/10,推动了中小型企业低成本接入AI,对行业产生了积极影响DeepSeek-R1促使行业开始从“唯规模论”转向更加注重“性价比”和“高效能”方向010203打破垄断价格下调推动创新DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作为由知名私募巨头幻方量化孕育而生的公司,DeepSeek获得了强大的资金支持和行业影响力,幻方量化与九坤投资、明汯投资、灵均投资并称量化私募领域的“四大天王”,管理资金规模均超过600亿元。这为DeepSeek提供了清晰的市场定位和投资者背景DeepSeek专注于开发先进的大语言模型(LLM)和相关技术,旨在通过这些技术推动人工智能在多个领域的应用和创新DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技企业,专注于人工智能基础技术的研究与开发公司成立背景与发展历程大语言模型(LLM)的创新应用投资者背景与市场定位里程碑DeepSeek产品信息官方渠道官网:www.deepseek.com新闻:https://api-docs.deepseek.com/zh-cn/news/news250120Github:https://github.com/deepseek-ai/对话:chat.deepseek.comDeepSeek模型系列DeepSeek最新的生成模型和推理模型版本对比比较方面生成模型(V3)推理模型(R1)设计初衷想要在各种自然语言处理的任务中都能表现好,更通用重点是为了搞定复杂的推理情况,比如深度的逻辑分析和解决问题性能展现在数学题、多语言任务还有编码任务里表现不错,像Cmath能得90.7分,Human Eval编码任务通过率是65.2%在需要逻辑思考的测试里很棒,比如DROP任务F1分数能达到92.2%,AIME 2024的通过率是79.8%应用的范围适合大规模的自然语言处理工作,像对话式AI、多语言翻译还有内容生成等等,能给企业提供高效的AI方案,满足好多领域的需求适合学术研究、解决问题的应用和决策支持系统等需要深度推理的任务,也能拿来当教育工具,帮

立即下载
信息科技
2025-02-25
北京大学
98页
12.03M
收藏
分享

[北京大学]:DeepSeek内部研讨系列:DeepSeek与AIGC应用,点击即可下载。报告格式为PDF,大小12.03M,页数98页,欢迎下载。

本报告共98页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共98页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
回顶部
报告群
公众号
小程序
在线客服
收起