AI行业系列点评：AI大模型竞争加剧，国内海外多点开花

行业及产业行业研究/行业点评证券研究报告计算机 2024 年 03 月 11 日 AI 大模型竞争加剧，国内海外多点开花看好 ——AI 行业系列点评相关研究 "华为 2024 年合作伙伴大会核心看点有哪些？ -全年关注计算 + 鸿蒙 +盘古+Meta " 2024 年 3 月 10 日 "AI 大模型多点开花！新质生产力落地新型工业化！ - 计算机行业周报20240304-20240308" 2024 年 3 月 9 日证券分析师洪依真 A0230519060003 hongyz@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 研究支持洪依真 A0230519060003 hongyz@swsresearch.com 联系人洪依真 (8621)23297818× hongyz@swsresearch.com 本期投资提示：  国产大模型 Kimi、海外大模型 Claude3 新发布，可以达到 GPT-4 的大模型继续增加！Kimi 和 Claude3 均有超预期性能表现。  Kimi chat 是月之暗面推出的对话助手工具，于 2023 年 10 月 10 日发布，发布之初即定位长文本。支持输入 20 万汉字，是目前国产大模型中支持的最长上下文输入长度， 2024年 2 月，kimi 迭代了网站、多问题搜索能力，可用性继续提升。Kimi 中英文生成能力已接近 GPT-4 水平，主要优势在语言理解和长文本处理，复杂逻辑推理、数学解题和多模态能力暂缺或稍弱。内部实测其长文本处理能力让论文总结、会议纪要变得更具可用性，加上联网搜索功能，对于需要查阅大量信息和处理会议纪要的办公人群有极大助力，未来办公类 AI 应用或将受益。Kimi 成功启示：我们认为团队成员能力、资金储备、时间可能是 Kimi 目前较为成功的原因。  截至目前，国内大模型的文字生成能力已经整体接近 GPT-4 Turbo。上海人工智能实验室 OpenCompass2.0 测评结果显示，不少国内厂商近期新发布的模型在多个能力维度上正在快速缩小与 GPT-4 Turbo 的差距，包括智谱清言 GLM-4、阿里 Qwen-Max、百度文心一言 4.0 等。我们认为在 2 点上仍有差距：1）大模型普遍在复杂推理能力上有提升空间，包括 GPT4-Turbo，但明显领先国内商业和开源模型。2）图生文能力，目前阿里Qwen-VL 暂时能力位居前列，实测来看能够理解简单图片，初步具备基于视觉完成复杂推理的能力，但复杂计算及视觉问题上较 GPT4V 仍有提升空间。  3 月 4 日，OpenAI 竞争对手之一 Anthropic 推出最新 Claude3 大模型，效果好于Gemini。中英文生成、理解、推理，多模态图片理解能力均与 GPT-4 接近，且实际使用中生成速度快于 GPT-4 和 Gemini。内部实测我们认为 Claude3 在如下几点能力上有提升和突破：1）更快的响应速度。2）多模态能力。3）更强小语种能力。  整体来看，市场可能认为海外大模型迭代放缓，但我们认为 2024 年模型能力仍然快速迭代。包括 Open AI 以外的其他模型能力追赶、Llama3 等开源大模型发布、下半年 OpenAI的新模型迭代等。  推荐标的：1）AI 办公应用：金山办公、福昕软件；2）多模态算法布局：科大讯飞、虹软科技、万兴科技、大华股份；3）多模态应用：焦点科技（互联网传媒）、上海电影（互联网传媒）、光线传媒（互联网传媒）、巨人网络（互联网传媒）、华策影视（互联网传媒）、易点天下（互联网传媒）  风险提示：大模型技术中美仍存在差异，部分技术尚处于早期实验室阶段，存在落地风险；竞争加剧影响利润率风险；AIGC 技术演变过快风险。请务必仔细阅读正文之后的各项信息披露与声明行业点评请务必仔细阅读正文之后的各项信息披露与声明第 2 页共 10 页简单金融成就梦想一、国产大模型 Kimi、海外大模型 Claude3 新发布，可以达到 GPT-4 的大模型继续增加！根据我们内部测评：Kimi 中英文生成能力已经接近 GPT-4 水平，尽管实际测试中复杂逻辑、数学能力仍有差距，且主打文字生成、目前无多模态能力；Cluade3 中英文生成、理解、推理，多模态图片理解能力均与 GPT-4 接近，效果好于 Gemini，且实际使用中生成速度快于 GPT-4 和 Gemini。表 1：内部测评各模型中英文文字生成能力情况中文题得分情况国内团队美国团队欧洲团队 kimi ChatGLM-4 GPT4 claude3 mistral 10 题中正确题目数 8 9 9 8 3 英文题得分情况国内团队美国团队欧洲团队 kimi ChatGLM-4 GPT4 claude3 mistral 5 题中正确题目数 3 4 3 3 4 资料来源：Kimi、ChatGLM-4、Open AI、Claude、Mistral 等官网，申万宏源研究 Kimi：国产大模型长文本能力突破，实测文字生成、文本总结等能力接近 GPT-4。 Kimi chat 是月之暗面推出的对话助手工具，于 2023 年 10 月 10 日发布，发布之初即定位长文本。支持输入 20 万汉字，是目前国产大模型中支持的最长上下文输入长度， 2024 年 2 月，kimi 迭代了网站、多问题搜索能力，可用性继续提升。我们认为其在长文本单点能力上实现突破，精准定位办公人群。Kimi 支持 20 万汉字的长文本输入，对比来看，GPT-4 Turbo-128k 的能力是约 10 万汉字，Claude3 200k 上下文是约 16 万汉字。因此，Kimi 更适用于高效阅读、专业文件解读、资料查询、资料整理总结等方面。 1）专业论文要点归纳总结任务的表现和 GPT4 大致相同，响应迅速，约 10 秒可以读完论文并给出回答。回答内容简要，能够根据文档精准回复追问，体现了模型较好的逻辑推理能力。图 1 kimi 处理 14 万字左右论文图 2 针对论文内容追问的回答资料来源：kimi chat，申万宏源研究资料来源：kimi chat，申万宏源研究行业点评请务必仔细阅读正文之后的各项信息披露与声明第 3 页共 10 页简单金融成就梦想 2）资料整理总结方面 kimi 在会议纪要总结能力上具有优势，选取一场会议的录音转录文本（分成两份 pdf）给到模型进行文本纠错和全文总结，kimi 的纠错能力和总结能力强于 GPT4，例如 kimi 能根据上下文将“贝尔 BT 这个 T23，T 五”这个乱码纠正为“BERT”,并告知可能指 BERT 模型，其全文总结结果也比 GPT4 结果更具可用性。图 3 kimi 对会议纪要的纠错及总结图 4 GPT4 对会议

立即下载

综合

2024-03-12

申万宏源

10页

2.74M

[申万宏源]:AI行业系列点评：AI大模型竞争加剧，国内海外多点开花，点击即可下载。报告格式为PDF，大小2.74M，页数10页，欢迎下载。

本报告共10页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共10页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

AI行业系列点评：AI大模型竞争加剧，国内海外多点开花

关于我们

联系我们

AI行业系列点评：AI大模型竞争加剧，国内海外多点开花

关于我们

联系我们

小程序

公众号