计算机行业专题研究-GPT产业梳理:GPT-1到ChatGPT

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 计算机 GPT 产业梳理:GPT-1 到 ChatGPT 华泰研究 计算机 增持 (维持) 研究员 谢春生 SAC No. S0570519080006 SFC No. BQZ938 xiechunsheng@htsc.com +(86) 21 2987 2036 联系人 袁泽世,PhD SAC No. S0570122080053 yuanzeshi@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2023 年 2 月 14 日│中国内地 专题研究 ChatGPT:三个阶段打造智能对话交互式 AI 模型 ChatGPT 从诞生到现在,经历了三个大版本阶段演进。2018 年,生成式预训练模型 GPT-1 诞生,引入有监督的微调训练。2019 年,GPT-2 以增加模型通用性为目标,移除 GPT-1 的微调,以更大的参数量和多任务训练,进行 zero-shot 学习;2020 年,GPT-3 用 few-shot 代替 zero-shot,并将训练参数增加到 1750 亿,再次提高模型表现性能。2022 年,InstructGPT 引入基于人类反馈的强化学习(RLHF),在 GPT-3 基础上进行奖励训练,以 13亿训练参数实现了更好的模型性能。2022 年 11 月,基于 InstructGPT,OpenAI 正式推出对话交互式模型 ChatGPT,5 天时间突破了 100 万用户。 GPT-1 阶段:开启生成式预训练模型时代 GPT-1 基于 Transformer 架构,仅保留了架构中的解码器(Decoder)部分。GPT-1 的训练过程包括预训练和微调两个阶段。1)阶段一:预训练采用内含长段连续文本的 BooksCorpus 数据集,进行高容量无监督学习。2)阶段二:在做下游任务时,首先根据任务类型将其转换为不同的输入形式,再针对不用类型任务用特定训练集进行微调训练。GPT-1 的参数量为 1.17 亿。GPT-1 在常识推理、问题回答、文本蕴涵等任务上分别比对比方法进步了8.9%、5.7%和 1.5%。 GPT-2 阶段:无监督训练替代有监督训练 GPT-2 通过海量数据和庞大的模型参数训练出更为通用的模型,无需经过特定的数据集训练也能解决各类问题,即 zero-shot learning(零次学习),从而提高模型的泛化能力。GPT-2 在架构上与 GPT-1 基本保持相同,预训练阶段与 GPT-1 方法一致,采用了更大的数据集 WebText。处理下游任务时,以无监督的训练方式进行 zero-shot 学习,通过增加 prompt 文本提示的方式提示模型具体任务类型。GPT-2 的参数量增加到 15 亿。GPT-2 在命名实体识别、阅读理解等任务上表现优异,在部分任务上不及预期。 GPT-3 阶段:性能不断突破,开启商业探索 GPT-3 在 GPT-2 架构基础上,舍弃极端的 zero-shot,采用 few-shot 理念,对于特定任务给予少量(10-100 个)样例。GPT-3 最大训练参数量为 1750亿,训练结果准确度随着 few-shot 样例的增加有明显提高。基于 GPT-3,OpenAI 发布了 Codex 和 InstructGPT。Codex 是通用代码生成模型,能够将自然语言转换为代码,支持十几种编程语言。InstructGPT 在 GPT-3 基础上通过 RLHF 训练奖励模型来进一步优化训练结果,仅用 13 亿参数量即可实现更符合人类需求的输出。此外,2020 年 6 月,OpenAI 开始对外提供接入 GPT-3 服务的 API,并按照模型类型进行收费,开启商业探索第一步。 ChatGPT 阶段:各大互联网厂商争相推出类似产品 2022 年 11 月,基于 InstructGPT,OpenAI 发布了以对话方式交互的ChatGPT。ChatGPT 训练方法与 InstructionGPT 基本相同,区别仅在于在微调时基于 InstructGPT 而非 GPT-3。随着 ChatGPT 用户的增多,OpenAI推出了按月订阅的 ChatGPT Plus 服务,开启第二次商业尝试。国内外互联网厂商纷纷跟进,微软发布基于 ChatGPT 的新版 Bing,谷歌发布 Bard 对标 ChatGPT;百度宣布推出类 ChatGPT 应用“文心一言”,京东推出智能人机对话平台 ChatJD,阿里宣布公司正在研发“阿里版”ChatGPT,网易有道和 360 也表示推出类 ChatGPT 应用。 风险提示:宏观经济波动,下游需求不及预期。本报告内容均基于客观信息整理,不构成投资建议。 (30)(21)(12)(3)6Feb-22Jun-22Oct-22Feb-23(%)计算机沪深300仅供内部参考,请勿外传 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 计算机 正文目录 ChatGPT:三个阶段打造智能对话交互式 AI 模型 ....................................................................................................... 3 GPT-1 阶段:开启生成式预训练模型时代 .................................................................................................................... 4 GPT-1:在 Transformer 架构基础上,引入微调训练 ........................................................................................... 4 GPT-2 阶段:无监督训练替代有监督训练 .................................................................................................................... 5 GPT-2:取消微调,用更大参数和数据集进行 zero-shot 学习 .............................................................................. 5 OpenAI:得到微软注资,关注技术滥用问题 ........................................................................................................ 6 GPT-3 阶段:性能不断突破,开启商业探索 .................................

立即下载
电子设备
2023-02-15
华泰证券
17页
2.04M
收藏
分享

[华泰证券]:计算机行业专题研究-GPT产业梳理:GPT-1到ChatGPT,点击即可下载。报告格式为PDF,大小2.04M,页数17页,欢迎下载。

本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
英维克全液冷端到端布局
电子设备
2023-02-14
来源:计算机:AIGC加速芯片级液冷散热市场爆发
查看原文
部分上市公司数据中心液冷布局情况(2023.2.13收盘价)
电子设备
2023-02-14
来源:计算机:AIGC加速芯片级液冷散热市场爆发
查看原文
2021、2025年全球及中国AI服务器出货量
电子设备
2023-02-14
来源:计算机:AIGC加速芯片级液冷散热市场爆发
查看原文
2018年来大规模语言模型参数增长趋势
电子设备
2023-02-14
来源:计算机:AIGC加速芯片级液冷散热市场爆发
查看原文
各个地区半导体刺激计划汇总
电子设备
2023-02-14
来源:半导体行业深度报告:关注基本面变化,审慎对待市场回暖
查看原文
美国半导体与科技法案补贴时间表(单位:十亿美元)
电子设备
2023-02-14
来源:半导体行业深度报告:关注基本面变化,审慎对待市场回暖
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起