通信行业深度-开源竞速:AI大模型的“Linux时刻”降临

请仔细阅读本报告末页声明 证券研究报告|行业深度 2023 年 05 月 31 日 通信 开源竞速:AI 大模型的“Linux 时刻”降临 ChatGPT 发布后不久,Meta 就开源了类 GPT 大语言模型 LLaMA,此后,Alpaca、Vicuna、Koala 等多个大模型诞生,它们以远低于 ChatGPT 的模型规模和成本,实现了令人瞩目的性能,引发业内人士担忧“谷歌和OpenAI 都没有护城河,大模型门槛正被开源踏破,不合作就会被取代”。资本市场也在关注大模型未来竞争格局如何,模型小了是否不再需要大量算力,数据在其中又扮演了什么角色?……本报告试图分析这波开源大语言模型风潮的共同点,回顾开源标杆 Linux 的发展史,回答这些问题。 共同点一:始于开源。开源≠免费,开源的商业模式至少包括:1、靠服务变现。曾上市、后被 IBM 收购的 Linux 企业服务公司红帽即是一例。企业为了更稳定和及时的技术支持,愿意付费。2、靠授权费变现。安卓开源,但谷歌向欧盟使用安卓谷歌套件的厂商收取许可费即是一例。3、许可证、标准和能力评价体系的发展,是开源大模型商用程度深化的催化剂。这波开源大模型采用的许可证协议主要是 Apache 2.0 和 MIT,它们不禁止商用,并且不禁止用户修改模型后闭源,这有助于公司应用此类大模型。 共同点二:参数少、小型化。相较于 GPT3+千亿参数超大模型,这波开源大模型的参数量普遍在十亿至百亿级别。目前尚没有一套系统的大模型性能评价体系,其中仅部分任务有公信力较强的评分标准。开源大模型中,Vicuna 的能力也较强,在部分任务能达到 92% GPT4 的效果。总体来说,OpenAI GPT 系仍一骑绝尘,但训练成本高,难复现。而开源大模型借助更大标识符训练数据集、DeepSpeed、RLHF 等方式,实现低训练成本和高性能,超大模型以下大模型的壁垒正在消失。 共同点三:数据集重视人类指令,并走向商用。ChatGPT 相较于 GPT3 效果大幅提升的重要因素是使用了 RLHF(基于人类反馈的强化学习),即在训练中,使用人类生成的答案和对 AI 生成内容的排序,来让 AI“对齐”人类偏好。LLaMA 没有使用指令微调,但 LLaMA 之后的大量大模型使用并开源了指令数据集,并且逐步探索自建指令数据集,而非使用有商用限制的 OpenAI 的,进一步降低了复现 GPT 的门槛,扩展了商用可用性。 接下来怎么看开源大模型?站在开源大模型浪潮中,我们注意到两个趋势:1)与多模态融合,清华大学的 VisualGLM-6B 即是著名开源语言模型ChatGLM 的多模态升级版,我们认为,其可基于消费级显卡在本地部署的特性是大势所趋。2)开源模型+边缘计算推动 AI 商用落地,哈尔滨大学的中文医疗问诊模型“华驼”以及在跨境电商的使用就是案例。 投资建议:我们认为,对大模型的看法应该分时、分层看待。1、短期内,OpenAI 的 GPT 系超大模型仍然超越众开源大模型,因此,应当重点关注与其在股权和产品上深度合作的微软、能获得 ChatGPTios App 收益分成的苹果,以及超大模型的算力服务商英伟达等;2、中长期来看,如果部分开源大模型能力被进一步验证,则应用将快速铺开,大模型对算力将形成正循环;3、其他:边缘算力、大数据公司和开源大模型服务商业态也值得关注。建议关注:1)智能模组服务商:美格智能、广和通;2)边缘IDC 服务商:龙宇股份、网宿科技;3)光模块服务商:中际旭创、新易盛、天孚通信、源杰科技;4)传统的 IoT 通信芯片厂商:有望受益行业上行过程。建议关注:中兴通讯、工业富联、翱捷科技、初灵信息;5)应用端标的:恺英网络、神州泰岳、佳讯飞鸿、中科金财等。 风险提示:伦理风险、市场竞争风险、政策法律监管风险。 增持(维持) 行业走势 作者 分析师宋嘉吉 执业证书编号:S0680519010002 邮箱:songjiaji@gszq.com 分析师孙爽 执业证书编号:S0680521050001 邮箱:sunshuang@gszq.com 相关研究 1、《通信:海外 AI 算力的新看点》2023-05-28 2、《通信:边缘计算——始于 AI,赋能应用》2023-05-21 3、《通信:算力为王,中心、边缘齐发力》2023-05-21 -16%0%16%32%48%64%2022-052022-092023-012023-05通信沪深3002023 年 05 月 31 日 P.2请仔细阅读本报告末页声明 内容目录 1 引言 ................................................................................................................................................................... 4 1.1“谷歌和 OpenAI 都没有护城河,大模型门槛正被开源踏破” ........................................................................ 4 1.2 开源大模型集中出现,堪称风潮 ................................................................................................................. 4 1.2.1“LLaMA 系”:表现好,但商用化程度低 ............................................................................................. 4 1.2.2 Dolly2.0、RedPajama、StableLM 等:商用化程度高 ........................................................................... 5 1.2.3 中文双子星:ChatGLM-6B 和 MOSS .................................................................................................. 5 2 共同点一:始于开源 ............................................................................................................................................ 7 2.1 为什么要开源? ...................................................................................................................................

立即下载
信息科技
2023-05-31
国盛证券
27页
3.9M
收藏
分享

[国盛证券]:通信行业深度-开源竞速:AI大模型的“Linux时刻”降临,点击即可下载。报告格式为PDF,大小3.9M,页数27页,欢迎下载。

本报告共27页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共27页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
MR 相关标的一览
信息科技
2023-05-31
来源:电子行业深度研究:行业奇点将近,积极把握苹果MR新品周期
查看原文
LCD、OLED、Micro OLED、Micro LED 显示技术对比
信息科技
2023-05-31
来源:电子行业深度研究:行业奇点将近,积极把握苹果MR新品周期
查看原文
不 同 VR 光学方案
信息科技
2023-05-31
来源:电子行业深度研究:行业奇点将近,积极把握苹果MR新品周期
查看原文
三 种常见的 VR 光学解决方案对比
信息科技
2023-05-31
来源:电子行业深度研究:行业奇点将近,积极把握苹果MR新品周期
查看原文
苹 果 MR 的 BOM 表与供应商
信息科技
2023-05-31
来源:电子行业深度研究:行业奇点将近,积极把握苹果MR新品周期
查看原文
苹果公司已经在硬件、软件和内容层面储备了大量 MR 相关技术
信息科技
2023-05-31
来源:电子行业深度研究:行业奇点将近,积极把握苹果MR新品周期
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起