AI行业系列点评：智谱AI重磅发布新一代基座大模型GLM-4，全面逼近GPT-4

行业及产业行业研究/行业点评证券研究报告计算机 2024 年 01 月 18 日智谱 AI 重磅发布新一代基座大模型GLM-4，全面逼近 GPT-4 看好 ——AI 行业系列点评相关研究 "AI+万物，五大亮点看 CES-AIGC 系列深度之 29" 2024 年 1 月 15 日 "GPTs Store 正式上线，推进 AIGC 应用生态 -AI 行业系列点评" 2024 年 1 月 14 日证券分析师洪依真 A0230519060003 hongyz@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 研究支持洪依真 A0230519060003 hongyz@swsresearch.com 联系人洪依真 (8621)23297818× hongyz@swsresearch.com 本期投资提示： ⚫ 事件：2024 年 1 月 16 日智谱 AI DevDay 正式发布新一代基座大模型 GLM-4，宣布性能全面逼近 GPT-4。同时上线 GLM-4 All Tools 平台、GLMs 智能体创建能力和 GLMs商店，后续将推出开发者收入计划。 ⚫ 全栈自主创新 GLM-4 全家桶，在多模态理解、复杂长文本、和自动解决复杂任务上都有较大提升，全面对标 GPT-4： ⚫ 1. 性能全面较上一代提升 60%：英文基础能力、中英文指令跟随能力和中文对齐能力上接近 GPT-4，中文对齐能力基本超越，部分超过 Turbo 版本，推理方面仍需加强。 ⚫ 2. 在总结、信息抽取、复杂推理、代码等应用场景复杂长文本能力提升：支持 128K token，单次提示词可处理文本达 300 页，解决上下文长度失焦导致精度下降问题。 ⚫ 3. 多模态理解能力提升：a) 最新文生图 CogView3 模型在对齐、保真、安全、组合布局各维度测试上平均达 DALL-E3 95%性能。b) 多模态理解模型 CogVLM 增加视觉专家特殊结构，保证不损耗原语言模型能力的基础上实现更好的视觉理解能力。 ⚫ 4. 更强编码能力：基础模型能力提升下加入代码补全、代码问答、代码解释器和检索增强特性，提升准确率同时解决少样本提示可控性差、模型幻觉和无法执行代码获得反馈问题。 ⚫ Agent 能力是未来重点，1）通过视觉理解能力和 GUI 的互动方式更类似于人类。2）重磅上线 GLM-4 All Tools 实现去全家桶能力 All-in-One，自主根据用户意图理解规划复杂指令，自由调用搜索增强、代码解释器和多模态生成能力完成复杂任务。此前回答复杂的数学问题一直是语言模型的难题，GLM-4 All Tools 实现自动理解及调用 python 解释器准确答题从而扬长避短。在多项测试集上的表现均媲美甚至超过 GPT-4 All Tools。 ⚫ 智谱 AI 基于 GLM-4 All Tools 推出 GLMs 和 GLMs 中心，全栈式对标 OpenAI，后续公布开发者收入计划有望打造国产国内全栈自创 AIGC 应用生态，尽管有较大创新，但我们认为无论是 GPTs 商店还是 GLMs 中心，是否能形成像 App store 的生态还具有不确定性：如何完善监管、定制合理的开发者收入计划是后续重点。 ⚫ 预计 2024 年 AIGC 应用将持续爆发，对于 A 股上市公司而言，我们认为 GLMs 中心的出现短时间内还不会带来大变革，依旧是各公司应用百花齐放，长期须看后续平台反响和开发者收入计划的实施情况。建议后续投资者重点关注多模态模型、数据、应用等相关公司。 ⚫ 相关标的。多模态算法布局：科大讯飞、云从科技、虹软科技、万兴科技、大华股份。多模态应用：紫天科技（互联网传媒）、易点天下（互联网传媒）、焦点科技（互联网传媒）、美图公司（互联网传媒）、福昕软件、萤石网络。行业 LLM 应用：金山办公、新致软件、同花顺、东方财富、润达医疗（申万医药）、星环科技、汉得信息。 ⚫ 风险提示：AI 商店模式仍处于早期探索阶段；大模型技术中美仍存在差异，部分技术尚处于早期实验室阶段，存在落地风险；竞争加剧影响利润率风险；AIGC 技术演变过快风险。请务必仔细阅读正文之后的各项信息披露与声明行业点评请务必仔细阅读正文之后的各项信息披露与声明第2页共7页简单金融成就梦想事件：2024 年 1 月 16 日智谱 AI DevDay 正式发布新一代基座大模型 GLM-4，宣布性能全面逼近 GPT-4。同时上线 GLM-4 All Tools 平台、GLMs 智能体创建能力和GLMs 商店，后续将推出开发者收入计划。全栈自主创新 GLM-4 全家桶，更强多模态和智能体能力，全线对标 GPT-4。图 1：GLM-4 全栈对标 GPT-4 全家桶资料来源：智谱 AI DevDay，申万宏源研究全面性能提升，强化多模态能力： 1. 性能全面较上一代提升 60%：英文基础能力、中英文指令跟随能力和中文对齐能力上接近 GPT-4，中文对齐能力基本超越，部分超过 Turbo 版本，推理方面仍需加强。图 2：各项测试集上结果接近 GPT-4，中文对齐能力显著资料来源：智谱 AI DevDay，申万宏源研究 2. 复杂长文本能力提升：支持 128K token，单次提示词可处理文本达 300 页。解决上下文长度失焦导致精度下降问题，在总结、信息抽取、复杂推理、代码等应用场景实现复杂长文本能力。在 LongBench（128K）测试集上性能超越 GPT-4。行业点评请务必仔细阅读正文之后的各项信息披露与声明第3页共7页简单金融成就梦想图 3： LongBench 测试集上结果超 GPT-4，needle test100%召回率资料来源：智谱 AI DevDay，申万宏源研究 3. 多模态理解能力提升： a) 最新发布文生图 CogView3 效果显超开源StableDiffusion，接近最新 DALL-E3，在对齐、保真、安全、组合布局的各维度测试上，相对 DALL-E3 平均达 95%性能。b) 多模态理解模型 CogVLM 增加视觉专家特殊结构，保证不损耗原语言模型能力的基础上实现更好的视觉理解能力。图 4：CodeView3 实现较复杂要求作图图 5：在语言模型基础上引入视觉专家结构资料来源：智谱 AI DevDay，申万宏源研究资料来源：《CogVLM：Visual Expert for Large Language Models》，申万宏源研究 4. 更强编码能力：之前 GPT-4 在 HumanEval（0-shot）数据集上的评估准确率由48.1%提升至 67.0%，属于行业第一梯队，此次 GLM-4 推出新一代 CodeGeeX模型，在基础模型

立即下载

综合

2024-01-19

申万宏源

7页

1.7M

[申万宏源]:AI行业系列点评：智谱AI重磅发布新一代基座大模型GLM-4，全面逼近GPT-4，点击即可下载。报告格式为PDF，大小1.7M，页数7页，欢迎下载。

本报告共7页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共7页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

AI行业系列点评：智谱AI重磅发布新一代基座大模型GLM-4，全面逼近GPT-4

关于我们

联系我们

AI行业系列点评：智谱AI重磅发布新一代基座大模型GLM-4，全面逼近GPT-4

关于我们

联系我们

小程序

公众号