计算机行业专题研究:“安卓版”大模型助推,算力和应用的黄金时代
行业报告 | 行业专题研究 请务必阅读正文之后的信息披露和免责申明 1 计算机 证券研究报告 2023 年 08 月 13 日 投资评级 行业评级 强于大市(维持评级) 上次评级 强于大市 作者 缪欣君 分析师 SAC 执业证书编号:S1110517080003 miaoxinjun@tfzq.com 刘鉴 联系人 liujianb@tfzq.com 资料来源:聚源数据 相关报告 1 《计算机-行业点评:操作系统政府采购标准发布,信创投资进入 2.0 阶段》 2023-08-07 2 《计算机-行业专题研究:新一代证券IT核 心 方 向 : 分 布 式 + 信 创 》 2023-08-06 3 《计算机-行业点评:产业见闻系列二:信 创 , 还 在 发 生 哪 些 新 变 化 ? 》 2023-08-05 行业走势图 “安卓版”大模型助推,算力和应用的黄金时代 开源生态与技术的发展不断降低大模型强化学习的数据与工程门槛 人类反馈的强化学习(RLHF)是 ChatGPT 类模型的重要步骤,随着开源生态的发展,这一步骤的门槛逐渐降低。4 月 12 日,微软开源了基于此优化库的 DeepSpeed Chat,此优化库拥有强化推理、RLHF 模块、RLHF 系统三大核心功能,使得 RLHF 的训练大幅加快(比现有系统快 15 倍)、成本降低且易于大规模推广(仅单 GPU 就可支持超 130 亿参数的模型);Self-instruct方法通过低成本生成指令微调数据集,可以解决大语言模型人工标注成本高的问题,同时效果较为显著,包括 Alpaca 等开源模型已经使用 self-instruct方法通过 openAI API 获取模型微调数据集。 开源模型生态方兴未艾,性能优异且参数量较小的大模型不断涌现,企业拥有自己的大模型指日可待 以 LLaMA 系列和 Dolly2.0 为代表的开源模型体系降低了打造大模型的门槛。Databricks 开源了可用于商用的大语言模型 Dolly 2.0,同时开源了人工产生指令微调的数据集,象征着大模型开源生态的进一步演进。LLaMA 系列是Meta 在 2023 年发布并逐步开源的大语言模型,此模型经过较大的数据集训练,LLaMA1 在模型参数 70 亿-650 亿的范围内表现出了较为优越的性能,运行成本相对较低,近期基于 LLaMA 打造的开源模型族不断涌现,Alpaca和 Vicuna 等模型在 LLaMA+微调后表现出了接近 chatGPT 的性能,且训练成本低廉;新推出的 LLaMA2 模型相较于一代在性能、安全性上进一步提升,且 Meta 开放了权限使其可用于商用。 我们看好开源生态对国内大模型产业的促进作用,开源基础模型+强化学习+行业垂直数据打造大模型或将成为重要手段,加速应用层与算力层的爆发 随着高性能的开源大模型与强化学习工具不断公开,我们认为基于开源模型打造行业应用的方式有望成为众多企业的选择,终端企业尤其是 2B 的企业在部署大模型时需要解决成本、安全和内容可信三大问题,需要在 L0 大模型基础上叠加企业自身优质数据的能力,基于开源模型打造行业垂直模型可以较好的满足这些需求;此外随着模型应用层生态的繁荣,我们同样看好算力层的爆发,企业在训练端与推理端的算力需求热潮有望持续。 风险提示:开源生态与开源技术发展速度不及预期、垂直行业大模型打造速度不及预期、终端应用场景拓展速度不及预期 -17%-9%-1%7%15%23%31%39%2022-082022-122023-04计算机沪深300 行业报告 | 行业专题研究 请务必阅读正文之后的信息披露和免责申明 2 内容目录 1. 新训练框架与训练数据获取手段不断涌现,开源生态助力 RLHF 训练门槛降低 ............ 3 1.1. 人类反馈的强化学习(RLHF)是 ChatGPT 类模型的重要步骤 .................................... 3 1.2. Deepspeed-Chat 开源,RLHF 训练工程难度迅速降低 ..................................................... 4 1.3. Self-Instruct 方法大幅降低指令微调数据集的成本............................................................. 5 2. 开源模型生态蓬勃发展,未来有望对抗闭源模型生态 ......................................................... 6 2.1. Dolly2.0:真正开放且可商用的大语言模型........................................................................... 6 2.2. LLaMA 及相关微调模型性能出众,Self-instruct 等技术加速模型 ................................ 6 2.2.1. LLaMA 在开源 L0 级模型中性能优越且运行成本低 ................................................ 6 2.2.2. 基于 LLaMA 构建的模型不断涌现,性能不俗 ......................................................... 8 2.3. LLaMA2 模型问世,性能提升且可用于商用,进一步加快“安卓”时刻到来......... 9 3. 大模型应用百花齐放局面或将加速到来,应用层与算力层爆发有望超预期 .................. 11 4. 投资建议 ....................................................................................................................................... 12 5. 风险提示 ....................................................................................................................................... 12 图表目录 图 1:InstructGPT 论文中基于人类反馈的强化学习的步骤 ............................................................. 3 图 2:DeepspeedChat 为 RLHF 的训练降低了门槛和成本 ............................................................... 4 图 3:Self-instruct 框架的数据集生成过程 ........
[天风证券]:计算机行业专题研究:“安卓版”大模型助推,算力和应用的黄金时代,点击即可下载。报告格式为PDF,大小2.06M,页数13页,欢迎下载。
