AI行业系列点评:智谱AI重磅发布新一代基座大模型GLM-4,全面逼近GPT-4

行业及产业 行业研究/行业点评 证券研究报告 计算机 2024 年 01 月 18 日 智谱 AI 重磅发布新一代基座大模型GLM-4,全面逼近 GPT-4 看好 ——AI 行业系列点评 相关研究 "AI+万物,五大亮点看 CES-AIGC 系列深度之 29" 2024 年 1 月 15 日 "GPTs Store 正式上线,推进 AIGC 应用生态 -AI 行业系列点评" 2024 年 1 月 14 日 证券分析师 洪依真 A0230519060003 hongyz@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 研究支持 洪依真 A0230519060003 hongyz@swsresearch.com 联系人 洪依真 (8621)23297818× hongyz@swsresearch.com 本期投资提示: ⚫ 事件:2024 年 1 月 16 日智谱 AI DevDay 正式发布新一代基座大模型 GLM-4,宣布性能全面逼近 GPT-4。同时上线 GLM-4 All Tools 平台、GLMs 智能体创建能力和 GLMs商店,后续将推出开发者收入计划。 ⚫ 全栈自主创新 GLM-4 全家桶,在多模态理解、复杂长文本、和自动解决复杂任务上都有较大提升,全面对标 GPT-4: ⚫ 1. 性能全面较上一代提升 60%:英文基础能力、中英文指令跟随能力和中文对齐能力上接近 GPT-4,中文对齐能力基本超越,部分超过 Turbo 版本,推理方面仍需加强。 ⚫ 2. 在总结、信息抽取、复杂推理、代码等应用场景复杂长文本能力提升:支持 128K token,单次提示词可处理文本达 300 页,解决上下文长度失焦导致精度下降问题。 ⚫ 3. 多模态理解能力提升:a) 最新文生图 CogView3 模型在对齐、保真、安全、组合布局各维度测试上平均达 DALL-E3 95%性能。b) 多模态理解模型 CogVLM 增加视觉专家特殊结构,保证不损耗原语言模型能力的基础上实现更好的视觉理解能力。 ⚫ 4. 更强编码能力:基础模型能力提升下加入代码补全、代码问答、代码解释器和检索增强特性,提升准确率同时解决少样本提示可控性差、模型幻觉和无法执行代码获得反馈问题。 ⚫ Agent 能力是未来重点,1)通过视觉理解能力和 GUI 的互动方式更类似于人类。2)重磅上线 GLM-4 All Tools 实现去全家桶能力 All-in-One,自主根据用户意图理解规划复杂指令,自由调用搜索增强、代码解释器和多模态生成能力完成复杂任务。此前回答复杂的数学问题一直是语言模型的难题,GLM-4 All Tools 实现自动理解及调用 python 解释器准确答题从而扬长避短。在多项测试集上的表现均媲美甚至超过 GPT-4 All Tools。 ⚫ 智谱 AI 基于 GLM-4 All Tools 推出 GLMs 和 GLMs 中心,全栈式对标 OpenAI,后续公布开发者收入计划有望打造国产国内全栈自创 AIGC 应用生态,尽管有较大创新,但我们认为无论是 GPTs 商店还是 GLMs 中心,是否能形成像 App store 的生态还具有不确定性:如何完善监管、定制合理的开发者收入计划是后续重点。 ⚫ 预计 2024 年 AIGC 应用将持续爆发,对于 A 股上市公司而言,我们认为 GLMs 中心的出现短时间内还不会带来大变革,依旧是各公司应用百花齐放,长期须看后续平台反响和开发者收入计划的实施情况。建议后续投资者重点关注多模态模型、数据、应用等相关公司。 ⚫ 相关标的。多模态算法布局:科大讯飞、云从科技、虹软科技、万兴科技、大华股份。多模态应用: 紫天科技(互联网传媒)、易点天下(互联网传媒)、焦点科技(互联网传媒)、美图公司(互联网传媒)、福昕软件、萤石网络。行业 LLM 应用:金山办公、新致软件、同花顺、东方财富、润达医疗(申万医药)、星环科技、汉得信息。 ⚫ 风险提示:AI 商店模式仍处于早期探索阶段;大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险;竞争加剧影响利润率风险;AIGC 技术演变过快风险。 请务必仔细阅读正文之后的各项信息披露与声明 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共7页 简单金融 成就梦想 事件:2024 年 1 月 16 日智谱 AI DevDay 正式发布新一代基座大模型 GLM-4,宣布性能全面逼近 GPT-4。同时上线 GLM-4 All Tools 平台、GLMs 智能体创建能力和GLMs 商店,后续将推出开发者收入计划。 全栈自主创新 GLM-4 全家桶,更强多模态和智能体能力,全线对标 GPT-4。 图 1:GLM-4 全栈对标 GPT-4 全家桶 资料来源:智谱 AI DevDay,申万宏源研究 全面性能提升,强化多模态能力: 1. 性能全面较上一代提升 60%:英文基础能力、中英文指令跟随能力和中文对齐能力上接近 GPT-4,中文对齐能力基本超越,部分超过 Turbo 版本,推理方面仍需加强。 图 2:各项测试集上结果接近 GPT-4,中文对齐能力显著 资料来源:智谱 AI DevDay,申万宏源研究 2. 复杂长文本能力提升:支持 128K token,单次提示词可处理文本达 300 页。解决上下文长度失焦导致精度下降问题,在总结、信息抽取、复杂推理、代码等应用场景实现复杂长文本能力。在 LongBench(128K)测试集上性能超越 GPT-4。 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第3页 共7页 简单金融 成就梦想 图 3: LongBench 测试集上结果超 GPT-4,needle test100%召回率 资料来源:智谱 AI DevDay,申万宏源研究 3. 多 模 态 理 解 能 力 提 升 : a) 最 新 发 布 文 生 图 CogView3 效 果 显 超 开 源StableDiffusion,接近最新 DALL-E3,在对齐、保真、安全、组合布局的各维度测试上,相对 DALL-E3 平均达 95%性能。b) 多模态理解模型 CogVLM 增加视觉专家特殊结构,保证不损耗原语言模型能力的基础上实现更好的视觉理解能力。 图 4:CodeView3 实现较复杂要求作图 图 5:在语言模型基础上引入视觉专家结构 资料来源:智谱 AI DevDay,申万宏源研究 资料来源:《CogVLM:Visual Expert for Large Language Models》,申万宏源研究 4. 更强编码能力:之前 GPT-4 在 HumanEval(0-shot)数据集上的评估准确率由48.1%提升至 67.0%,属于行业第一梯队,此次 GLM-4 推出新一代 CodeGeeX模型,在基础模型

立即下载
综合
2024-01-19
申万宏源
7页
1.7M
收藏
分享

[申万宏源]:AI行业系列点评:智谱AI重磅发布新一代基座大模型GLM-4,全面逼近GPT-4,点击即可下载。报告格式为PDF,大小1.7M,页数7页,欢迎下载。

本报告共7页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共7页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表10 中国分年龄人口情况(亿人)
综合
2024-01-19
来源:前瞻性产业行业动态跟踪报告:2022-2023年人口负增主要受短期因素扰动所致
查看原文
图表8 2021 年至今中国死亡率跃升 图表9 中国人口预期死亡分布(1950-2021 出生)
综合
2024-01-19
来源:前瞻性产业行业动态跟踪报告:2022-2023年人口负增主要受短期因素扰动所致
查看原文
图表6 粗结婚率、粗初婚率及出生率之间有相关性 图表7 粗初婚率与滞后年份出生率的相关系数
综合
2024-01-19
来源:前瞻性产业行业动态跟踪报告:2022-2023年人口负增主要受短期因素扰动所致
查看原文
图表3 2013 年以来出生率快速下降 图表4 2013 年以来生育适龄女性趋势性下降
综合
2024-01-19
来源:前瞻性产业行业动态跟踪报告:2022-2023年人口负增主要受短期因素扰动所致
查看原文
图表5 中国分孩次总和生育率
综合
2024-01-19
来源:前瞻性产业行业动态跟踪报告:2022-2023年人口负增主要受短期因素扰动所致
查看原文
图表1 2022 及 2023 年,中国人口首次负增 图表2 出生率大幅下降及死亡率跃升共同导致人口负增
综合
2024-01-19
来源:前瞻性产业行业动态跟踪报告:2022-2023年人口负增主要受短期因素扰动所致
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起