科技行业前瞻研究重大事项点评,Chat-GPT:对人工智能AI产业意味着什么?

证券研究报告 请务必阅读正文之后第 4 页起的免责条款和声明 Chat-GPT:对人工智能 AI 产业意味着什么? 前瞻研究重大事项点评|2022.12.7 中信证券研究部 核心观点 陈俊云 前瞻研究首席 分析师 S1010517080001 许英博 科技产业首席 分析师 S1010510120041 贾凯方 前瞻研究分析师 S1010522080001 刘锐 前瞻研究分析师 S1010522110001 近日,由人工智能实验室 OpenAI 发布的对话式大型语言模型 Chat-GPT 获得市场广泛关注。测试反馈的结果显示,相比于前一代的 GPT-3,Chat-GPT 给出的答案完成度很高,并能在专业领域内形成具有一定创作性的回答。技术背景上,OpenAI 团队从 GPT-3.5 系列中的一个模型进行微调,使用人类反馈强化学习 (RLHF) 训练该模型。这种技术使用人类偏好作为奖励信号来微调模型,在此前的 Transformer 算法的基础上又优化了数据来源。与 GPT-3 相比,Chat-GPT 测试所取得的进步是明显的,但这些进步主要来自于数学层面上优化带来的匹配精准度提高,而并非算法真正为 AI 带来了逻辑性。更直观的理解是,Chat-GPT“解锁”了 GPT-3 已经具备的能力,原先模型中真正使用到的计算和数据不到 2%,这让 Chat-GPT 成为一个 AI 技术应用的成功范例。对产业界而言,Chat-GPT 的成功意味着产业端算力与数据质量重要性进一步提升,人类反馈强化学习(RLHF)更强调数据质量与算力,在未来 Transformer 发展的过程中将越来越重要,一味堆叠数据量的时代可能已经过去。能够完成数据闭环以及有着优秀的数据自处理能力的企业预计将在未来 AI 模型发展的过程中更加受到青睐。场景落地端,根据模型现有的完成度,在垂直行业针对性地做人工反馈训练,就可以落地智能客服、问答产品,在 toC 场景中料将率先得到应用。Chat-GPT 的成功证明了 Transformer 模型并非陷入困境,AI 模型&技术上持续的新突破,正驱动全球 AI 产业进入加速发展阶段,叠加 AI 产业集群效应的不断凸显,拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为产业受益者。重点推荐:特斯拉、英伟达、AMD、高通等。 ▍事件背景:Chat-GPT 模型获得市场广泛关注,对话类 AI 效果远超大众预期。近日,由人工智能实验室 OpenAI 发布的对话式大型语言模型 Chat-GPT 引爆中文互联网。Chat-GPT 是 OpenAI 团队最新公布的语言模型,并于 11 月 30 日向社区发布测试。从测试反馈的结果看,相比于前一代的 GPT-3,Chat-GPT 给出的答案完成度很高,并能在专业领域内形成具有一定创作性的回答,并且对于不同语言都能支持。Chat-GPT 目前可以轻松与人类进行专业性的对话,回答各种问题,无论是写代码改 bug、回答科学问题,甚至给推特的发展提建议。这标志着对话式 AI 开始能在大范围、细粒度问题上给出普遍稳妥的答案,并根据上下文形成一定的逻辑性。本篇报告将关注 Chat-GPT 背后的技术逻辑、对 AI 算法发展的整体影响以及产业化的落地可能性。 ▍Chat-GPT 模型:在 GPT-3.5 的基础上基于人类反馈学习进行额外训练,给出了 Transformer 模型未来发展的一个可能解法。OpenAI 团队从 GPT-3.5 系列中的一个模型进行微调,使用与 InstructGPT 相同的方法,使用人类反馈强化学习 (RLHF) 训练该模型,并对数据收集设置相对做了优化。人类反馈强化模型这一技术,是 OpenAI 从 2017 开始发表论文的新领域。这种技术使用人类偏好作为奖励信号来微调模型,首先收集人工编写演示数据集(包含两种不同输出类型的比较),然后在这个数据集上训练一个奖励模型 (RM) 来预测标签者更喜欢哪个输出。最后,使用此 RM 作为奖励函数并微调这个 GPT-3 策略以使用 PPO 算法最大化此奖励。从测试的结果看,Chat-GPT 能够调用大量的专业数据库,并用巧妙的语言连接句将他们拼合在一起,在回答问题时,模型能根据上下文展现出一定的连贯性。在面对 GPT-3 束手无策的人称代词时,Chat-GPT展现出了一定的逻辑能力。 ▍模型背后问题:并非底层技术上的革命性突破,产业端意义大于学术端意义。与 GPT-3 相比,Chat-GPT 测试所取得的进步是明显的,但这些进步主要来自于数学层面上的优化带来的结果匹配精准度提高,而并非算法真正为 AI 带来了 仅供内部参考,请勿外传 前瞻研究行业重大事项点评|2022.12.7 请务必阅读正文之后的免责条款和声明 2 逻辑性,也不是能够从训练的数据中学习到新的知识。对于 Chat-GPT 相对于原先模型的进步的一种更直观的理解是,Chat-GPT“解锁”了 GPT-3 已经具备的能力,通过原先的提示工程难以激发:这是因为训练程序相对于预训练期间学到的东西,新知识的连接能力有限。这一过程带来了更好的结果匹配度来逼近人类思考所使用的逻辑,但并非给予了 AI 底层逻辑性的概念。从大量的测试结果能看出,Chat-GPT 有时仍会写出看似合理但不正确或荒谬的答案,以及幼儿都绝不会出现的逻辑性错误。主要原因包括:(1)在面对逻辑性的指代,以及稍微复杂的句式,模型仍然难以分析出内在的逻辑性关联;(2) 训练模型更加谨慎导致它拒绝回答和逃避回答问题;(3) 监督训练会误导模型,因为理想的答案取决于模型知道什么,而不是人类演示者知道什么。 ▍Chat-GPT 对产业界的影响:底层算力、数据质量重要性进一步提升,toC 端场景(智能客服等)料将率先迎来变革。1)人类反馈强化学习(RLHF)更强调数据质量与算力,尽管相比于 GPT-3,Chat-GPT 削减了一部分的数据量,但对于余下的数据做了更好的优化以及加入了人类反馈调节的奖励系统。数据质量与大算力支撑下的奖励系统预计将在未来 Transformer 发展的过程中越来越重要,一味堆叠数据量的时代可能已经过去。能够完成数据闭环以及有着优秀的数据自处理能力的企业将在未来 AI 模型发展的过程中更加受到青睐。2)即使 Chat-GPT不是一个革命性的底层 AI 技术的突破,但它绝对是一个成功的 AI 技术应用的典范。在原先 GPT-3.5 与 InstructGPT 的框架上,OpenAI 的研究员通过调试参数与数据源取得了惊人的效果。根据模型现有的完成度,在垂直行业针对性的做人工反馈训练,就可以落地为智能客服产品,在 toC 的场景中率先得到应用。对比目前的智能客服,Chat-GPT 支撑的客服将在灵活性与人性化服务方面有显著的进步。 ▍风险因素:AI 核心技术发展不及预期风险;科技领域政策监管持续收紧风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业 IT 支出不及预期风险;全球云计算市场发展不及预期风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。 ▍投资策略:Chat-GPT 模型的亮眼表

立即下载
综合
2022-12-08
中信证券
5页
0.71M
收藏
分享

[中信证券]:科技行业前瞻研究重大事项点评,Chat-GPT:对人工智能AI产业意味着什么?,点击即可下载。报告格式为PDF,大小0.71M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
本周上市公司重点公告
综合
2022-12-08
来源:社服行业周报:多地开启防疫政策优化,携程广州搜索量增长超300%
查看原文
中国与全球每百人新冠疫苗接种量(剂次) 图 20:北美与欧洲每百人新冠疫苗接种量(剂次)
综合
2022-12-08
来源:社服行业周报:多地开启防疫政策优化,携程广州搜索量增长超300%
查看原文
全球日新增确诊病例(人) 图 18:全球累计死亡病例(人)
综合
2022-12-08
来源:社服行业周报:多地开启防疫政策优化,携程广州搜索量增长超300%
查看原文
2022 年中国新冠确诊病例及无症状感染者人数(人) 图 16:上海每日新增确诊病例及无症状感染者人数(人)
综合
2022-12-08
来源:社服行业周报:多地开启防疫政策优化,携程广州搜索量增长超300%
查看原文
我国调查失业率(%)处于较高位置
综合
2022-12-08
来源:社服行业周报:多地开启防疫政策优化,携程广州搜索量增长超300%
查看原文
海口美兰机场客流量(万人次)
综合
2022-12-08
来源:社服行业周报:多地开启防疫政策优化,携程广州搜索量增长超300%
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起