DeepSeek大模型及其企业应用实践

DeepSeek大模型及其企业应用实践林子雨副教授厦门大学DeepSeek厦门大学大数据教学团队作品 2025年3月3日每个人都可以读懂的大模型科普报告（企业篇）厦门大学大数据教学团队团队联系方式：ziyulin@xmu.edu.cn国内高校大数据教学的重要贡献者团队负责人：林子雨副教授年轻力量：核心成员全部46周岁以下结构合理：教学型、科研型、实验工程师专注专业：从2013年至今，11年专注于大数据教学团队特点：眼光前瞻、紧跟技术、创新实干、执行力强影响力高：多项指标在国内高校大数据教学领域领先•教材数量•教材占有率•MOOC课程学习人数•师资培养•教学研讨会•教学网站访问量•在线讲座观看人数•……大模型系列报告（科普报告，非技术报告）n 报告1：大模型概念、技术与应用实践（面向社会大众）n 报告2：DeepSeek大模型赋能高校教学和科研（面向高校）n 报告3：DeepSeek大模型及其企业应用实践（面向企业）n 报告4：DeepSeek大模型赋能政府数字化转型（面向政府部门）报告下载地址：https://dblab.xmu.edu.cn/post/deepseek/扫码下载报告目录1. 大模型：人工智能的前沿2. 大模型产品3. 大模型的行业应用4. 企业大模型落地方案5. 智能体的企业应用6. 厂商提供的企业级大模型服务7. 大模型典型应用案例8. AIGC与企业应用实践9. 大模型未来发展趋势厦门大学大数据教学团队作品1.大模型：人工智能的前沿1.1 大模型的概念1.2 大模型的发展历程1.3 人工智能与大模型的关系1.4 大模型分类1.1 大模型的概念大模型通常指的是大规模的人工智能模型，是一种基于深度学习技术，具有海量参数、强大的学习能力和泛化能力，能够处理和生成多种类型数据的人工智能模型。通常说的大模型的“大”的特点体现在：参数数量庞大训练数据量大计算资源需求高2020年，OpenAI公司推出了GPT-3，模型参数规模达到了1750亿。2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上，达到1.8万亿，2021年11月阿里推出的M6 模型的参数量达10万亿。1.1 大模型的概念大模型的设计和训练旨在提供更强大、更准确的模型性能，以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律，具有更强的泛化能力和表达能力大模型具有更强的上下文理解能力，能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答上下文理解能力大模型可以从大量的数据中学习，并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色学习能力强大模型可以生成更自然、更流利的语言，减少了生成输出时呈现的错误或令人困惑的问题语言生成能力学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务，无需重新训练可迁移性高1.2 大模型的发展历程大模型发展历经三个阶段，分别是萌芽期、沉淀期和爆发期1.2 大模型的发展历程1.2 大模型的发展历程大模型发展对算力的需求演变1.3 人工智能与大模型的关系人工智能包含了机器学习，机器学习包含了深度学习，深度学习可以采用不同的模型，其中一种模型是预训练模型，预训练模型包含了预训练大模型（可以简称为“大模型”），预训练大模型包含了预训练大语言模型（可以简称为“大语言模型”），预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE，ChatGPT是基于GPT开发的大模型产品，文心一言是基于文心ERNIE开发的大模型产品人工智能机器学习深度学习深度学习模型预训练模型深度学习预训练大模型预训练大语言模型预训练大语言模型GPT文心ERNIE...ChatGPT文心一言1.4 大模型的分类语言大模型视觉大模型多模态大模型是指在自然语言处理（Natural Language Processing，NLP）领域中的一类大模型，通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练，以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列（OpenAI）、Bard（Google）、DeepSeek、文心一言（百度）等是指在计算机视觉（Computer Vision，CV）领域中使用的大模型，通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练，可以实现各种视觉任务，如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列（Google）、文心UFO、华为盘古CV、INTERN（商汤）等是指能够处理多种不同类型数据的大模型，例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力，以实现对多模态信息的综合理解和分析，从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库（九章云极DataCanvas）、DALL-E(OpenAI)、悟空画画（华为）、midjourney等1.4 大模型的分类按照应用领域的不同，大模型主要可以分为L0、L1、L2三个层级是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法，在大规模无标注数据上进行训练，以寻找特征并发现规律，进而形成可“举一反三”的强大泛化能力，可在不进行微调或少量微调的情况下完成多场景任务，相当于AI完成了“通识教育”通用大模型L0是指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调，以提高在该领域的性能和准确度，相当于AI成为“行业专家”行业大模型L1是指那些针对特定任务或场景的大模型。它们通常使用任务相关的数据进行预训练或微调，以提高在该任务上的性能和效果垂直大模型L21.4 大模型的分类大语言模型可以分为通用大模型和推理大模型推理大模型的概念大规模传播应该开始于2 0 2 4 年 9 月份。 2 0 2 4 年 9 月 1 2 日，OpenAI官方宣布了OpenAI o1推理大模型。推理大模型在OpenAI的官网上，OpenAI定义推理模型是在回答之前进行思考，并在回复用户之前，在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前，先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。OpenAI定义推理模型也就是说，如果模型在回复你之前有一长串的思考过程（这个过程必须可以显示输出），探索了很多不同的路径之后给出答案，那么有这个能力的大模型就是推理大模型。推理模型的核心在于处理那些需要多步骤逻辑推导才能解决的复杂问题。推理模型的核心1.4 大模型的分类n 推理大模型DeepSeek R1的对话效果1.4 大模型的分类Sebastian Raschka博士（Lightning AI的首席教育学家）：将“推理”定义为通过生成中间步骤来回答复杂问题的过程2个简单的例子：非推理问题：”法国的首都是哪里？”（答案直接、无需推导）推理问题：”一列火车以每小时60英里的速度行驶3小时，行驶距离是多少？”（需先理解”距离=速度×时间”的关系，再

立即下载

综合

2025-03-05

厦大团队

148页

17.72M

[厦大团队]:DeepSeek大模型及其企业应用实践，点击即可下载。报告格式为PDF，大小17.72M，页数148页，欢迎下载。

本报告共148页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共148页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

DeepSeek大模型及其企业应用实践

关于我们

联系我们

DeepSeek大模型及其企业应用实践

关于我们

联系我们

小程序

公众号