DeepSeek从入门到精通

DeepSeek:从入门到精通 清华大学新闻与传播学院 新媒体研究中心元宇宙文化实验室• Deepseek是什么?• Deepseek能够做什么?• 如何使用Deepseek?DeepSeek是什么?AI+国产+免费+开源+强大•DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。•DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。Deepseek可以做什么?直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成(如日程安排、菜谱)代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容(如推文、帖子)剧本或对话设计文本创作长文本摘要(论文、报告)文本简化(降低复杂度)多语言翻译与本地化摘要与改写020103文本生成自然语言理解与分析知识推理知识推理逻辑问题解答(数学、常识推理)因果分析(事件关联性)语义分析语义解析情感分析(评论、反馈)意图识别(客服对话、用户查询)实体提取(人名、地点、事件)文本分类文本分类主题标签生成(如新闻分类)垃圾内容检测编程与代码相关代码调试•错 误 分 析 与 修 复建议•代 码 性 能 优 化 提示技术文档处理•API文档生成•代码库解释与示例生成代码生成•根 据 需 求 生 成 代码片段(Python、JavaScript)•自 动 补 全 与 注 释生成常规绘图如何使用DeepSeek?https://chat.deepseek.com如何从入门到精通?当人人都会用AI时,你如何用得更好更出彩?推理模型 •例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务(如诗歌创作)需要严格逻辑链的任务(如数学证明)性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强,仅在其训练目标领域显著优于通用模型通用场景更灵活,但专项任务需依赖提示语补偿能力•例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。快思慢想:效能兼顾 全局视野概率预测(快速反应模型,如ChatGPT 4o)链式推理(慢速思考模型,如OpenAI o1)性能表现响应速度快,算力成本低慢速思考,算力成本高运算原理基于概率预测,通过大量数据训练来快速预测可能的答案基于链式思维(Chain-of-Thought),逐步推理问题的每个步骤来得到答案决策能力依赖预设算法和规则进行决策能够自主分析情况,实时做出决策创造力限于模式识别和优化,缺乏真正的创新能力能够生成新的创意和解决方案,具备创新能力人机互动能力按照预设脚本响应,较难理解人类情感和意图更自然地与人互动,理解复杂情感和意图问题解决能力擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题,提供创造性的解决方案伦理问题作为受控工具,几乎没有伦理问题引发自主性和控制问题的伦理讨论CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型,实现最佳效果。提示语策略差异12推理模型通用模型•提示语更简洁,只需明确任务目标和需求(因其已内化推理逻辑)。•无需逐步指导,模型自动生成结构化推理过程(若强行拆解步骤,反而可能限制其能力)。•需显式引导推理步骤(如通过CoT提示),否则可能跳过关键逻辑。•依赖提示语补偿能力短板(如要求分步思考、提供示例)。关键原则321模型选择•优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用模型)。提示语设计•推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。•通用模型:结构化、补偿性引导(“缺什么补什么”)。避免误区•不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。•不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。从“下达指令”到“表达需求”策略类型定义与目标适用场景示例(推理模型适用)优势与风险指令驱动直接给出明确步骤或格式要求简单任务、需快速执行 “用Python编写快速排序函数,输出需包含注释。”✅ 结果精准高效❌ 限制模型自主优化空间需求导向描述问题背景与目标,由模型规划解决路径复杂问题、需模型自主推理“我需要优化用户登录流程,请分析当前瓶颈并提出3种方案。”✅ 激发模型深层推理❌ 需清晰定义需求边界混合模式结合需求描述与关键约束条件平衡灵活性与可控性“设计一个杭州三日游计划,要求包含西湖和灵隐寺,且预算控制在2000元内。”✅ 兼顾目标与细节❌ 需避免过度约束启发式提问通过提问引导模型主动思考(如“为什么”“如何”)探索性问题、需模型解释逻辑“为什么选择梯度下降法解决此优化问题?请对比其他算法。”✅ 触发模型自解释能力❌ 可能偏离核心目标任务需求与提示语策略任务类型适用模型提示语侧重点示例(有效提示)需避免的提示策略数学证明 推理模型直接提问,无需分步引导“证明勾股定理”冗余拆解(如“先画图,再列公式”)通用模型显式要求分步思考,提供示例“请分三步推导勾股定理,参考:1. 画直角三角形…”直接提问(易跳过关键步骤)创意写作 推理模型鼓励发散性,设定角色/风格“以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”)通用模型需明确约束目标,避免自由发挥“写一个包含‘量子’和‘沙漠’的短篇小说,不超过200字”开放式指令(如“自由创作”)代码生成 推理模型简洁需求,信任模型逻辑“用Python实现快速排序”分步指导(如“先写递归函数”)通用模型细化步骤,明确输入输出格式“先解释快速排序原理,再写出代码并测试示例”模糊需求(如“写个排序代码”)多轮对话 通用模型自然交互,无需结构化指令“你觉得人工智能的未来会怎样?” 强制逻辑链条(如“分三点回答”)推理模型需明确对话目标,避免开放发散“从技术、伦理、经济三方面分析AI的未来”情感化提问(如“你害怕AI吗?”)逻辑分析 推理模型直接抛出复杂问题“分析‘电车难题’中的功利主义与道德主义冲突”添加主观引导(如“你认为哪种对?”)通用模型需拆分问题,逐步追问“先解释电车难题的定义,再对比两种伦理观的差异”一次性提问复杂逻辑如何向AI表达需求需求类型特点需求表达公

立即下载
信息科技
2025-02-07
清华大学
104页
5.62M
收藏
分享

[清华大学]:DeepSeek从入门到精通,点击即可下载。报告格式为PDF,大小5.62M,页数104页,欢迎下载。

本报告共104页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共104页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
回顶部
报告群
公众号
小程序
在线客服
收起