AI行业系列点评:AI大模型竞争加剧,国内海外多点开花

行业及产业 行业研究/行业点评 证券研究报告 计算机 2024 年 03 月 11 日 AI 大模型竞争加剧,国内海外多点开花 看好 ——AI 行业系列点评 相关研究 "华为 2024 年合作伙伴大会核心看点有哪 些 ? -全 年 关注 计算 + 鸿 蒙 +盘 古+Meta " 2024 年 3 月 10 日 "AI 大模型多点开花!新质生产力落地新型 工 业 化 ! - 计 算 机 行 业 周 报20240304-20240308" 2024 年 3 月 9 日 证券分析师 洪依真 A0230519060003 hongyz@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 研究支持 洪依真 A0230519060003 hongyz@swsresearch.com 联系人 洪依真 (8621)23297818× hongyz@swsresearch.com 本期投资提示:  国产大模型 Kimi、海外大模型 Claude3 新发布,可以达到 GPT-4 的大模型继续增加!Kimi 和 Claude3 均有超预期性能表现。  Kimi chat 是月之暗面推出的对话助手工具,于 2023 年 10 月 10 日发布,发布之初即定位长文本。支持输入 20 万汉字,是目前国产大模型中支持的最长上下文输入长度, 2024年 2 月,kimi 迭代了网站、多问题搜索能力,可用性继续提升。Kimi 中英文生成能力已接近 GPT-4 水平,主要优势在语言理解和长文本处理,复杂逻辑推理、数学解题和多模态能力暂缺或稍弱。内部实测其长文本处理能力让论文总结、会议纪要变得更具可用性,加上联网搜索功能,对于需要查阅大量信息和处理会议纪要的办公人群有极大助力,未来办公类 AI 应用或将受益。Kimi 成功启示:我们认为团队成员能力、资金储备、时间可能是 Kimi 目前较为成功的原因。  截至目前,国内大模型的文字生成能力已经整体接近 GPT-4 Turbo。上海人工智能实验室 OpenCompass2.0 测评结果显示,不少国内厂商近期新发布的模型在多个能力维度上正在快速缩小与 GPT-4 Turbo 的差距,包括智谱清言 GLM-4、阿里 Qwen-Max、百度文心一言 4.0 等。我们认为在 2 点上仍有差距:1)大模型普遍在复杂推理能力上有提升空间,包括 GPT4-Turbo,但明显领先国内商业和开源模型。2)图生文能力,目前阿里Qwen-VL 暂时能力位居前列,实测来看能够理解简单图片,初步具备基于视觉完成复杂推理的能力,但复杂计算及视觉问题上较 GPT4V 仍有提升空间。  3 月 4 日,OpenAI 竞争对手之一 Anthropic 推出最新 Claude3 大模型,效果好于Gemini。中英文生成、理解、推理,多模态图片理解能力均与 GPT-4 接近,且实际使用中生成速度快于 GPT-4 和 Gemini。内部实测我们认为 Claude3 在如下几点能力上有提升和突破:1)更快的响应速度。2)多模态能力。3)更强小语种能力。  整体来看,市场可能认为海外大模型迭代放缓,但我们认为 2024 年模型能力仍然快速迭代。包括 Open AI 以外的其他模型能力追赶、Llama3 等开源大模型发布、下半年 OpenAI的新模型迭代等。  推荐标的:1)AI 办公应用:金山办公、福昕软件;2)多模态算法布局:科大讯飞、虹软科技、万兴科技、大华股份;3)多模态应用:焦点科技(互联网传媒)、上海电影(互联网传媒)、光线传媒(互联网传媒)、巨人网络(互联网传媒)、华策影视(互联网传媒)、易点天下(互联网传媒)  风险提示:大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险;竞争加剧影响利润率风险;AIGC 技术演变过快风险。 请务必仔细阅读正文之后的各项信息披露与声明 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第 2 页 共 10 页 简单金融 成就梦想 一、国产大模型 Kimi、海外大模型 Claude3 新发布,可以达到 GPT-4 的大模型继续增加! 根据我们内部测评:Kimi 中英文生成能力已经接近 GPT-4 水平,尽管实际测试中复杂逻辑、数学能力仍有差距,且主打文字生成、目前无多模态能力;Cluade3 中英文生成、理解、推理,多模态图片理解能力均与 GPT-4 接近,效果好于 Gemini,且实际使用中生成速度快于 GPT-4 和 Gemini。 表 1:内部测评各模型中英文文字生成能力情况 中文题得分情况 国内团队 美国团队 欧洲团队 kimi ChatGLM-4 GPT4 claude3 mistral 10 题中正确题目数 8 9 9 8 3 英文题得分情况 国内团队 美国团队 欧洲团队 kimi ChatGLM-4 GPT4 claude3 mistral 5 题中正确题目数 3 4 3 3 4 资料来源:Kimi、ChatGLM-4、Open AI、Claude、Mistral 等官网,申万宏源研究 Kimi:国产大模型长文本能力突破,实测文字生成、文本总结等能力接近 GPT-4。 Kimi chat 是月之暗面推出的对话助手工具,于 2023 年 10 月 10 日发布,发布之初即定位长文本。支持输入 20 万汉字,是目前国产大模型中支持的最长上下文输入长度, 2024 年 2 月,kimi 迭代了网站、多问题搜索能力,可用性继续提升。 我们认为其在长文本单点能力上实现突破,精准定位办公人群。Kimi 支持 20 万汉字的长文本输入,对比来看,GPT-4 Turbo-128k 的能力是约 10 万汉字,Claude3 200k 上下文是约 16 万汉字。因此,Kimi 更适用于高效阅读、专业文件解读、资料查询、资料整理总结等方面。 1)专业论文要点归纳总结任务的表现和 GPT4 大致相同,响应迅速,约 10 秒可以读完论文并给出回答。回答内容简要,能够根据文档精准回复追问,体现了模型较好的逻辑推理能力。 图 1 kimi 处理 14 万字左右论文 图 2 针对论文内容追问的回答 资料来源:kimi chat,申万宏源研究 资料来源:kimi chat,申万宏源研究 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第 3 页 共 10 页 简单金融 成就梦想 2)资料整理总结方面 kimi 在会议纪要总结能力上具有优势,选取一场会议的录音转录文本(分成两份 pdf)给到模型进行文本纠错和全文总结,kimi 的纠错能力和总结能力强于 GPT4,例如 kimi 能根据上下文将“贝尔 BT 这个 T23,T 五”这个乱码纠正为“BERT”,并告知可能指 BERT 模型,其全文总结结果也比 GPT4 结果更具可用性。 图 3 kimi 对会议纪要的纠错及总结 图 4 GPT4 对会议

立即下载
综合
2024-03-12
申万宏源
10页
2.74M
收藏
分享

[申万宏源]:AI行业系列点评:AI大模型竞争加剧,国内海外多点开花,点击即可下载。报告格式为PDF,大小2.74M,页数10页,欢迎下载。

本报告共10页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共10页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
AI 重点公司估值表
综合
2024-03-12
来源:TMT行业AIGC流量跟踪系列之二-AIGC流量2月报解读:对话助手、 AI法律上涨,数字人高景气
查看原文
AI 创意工具
综合
2024-03-12
来源:TMT行业AIGC流量跟踪系列之二-AIGC流量2月报解读:对话助手、 AI法律上涨,数字人高景气
查看原文
AI 开发社区
综合
2024-03-12
来源:TMT行业AIGC流量跟踪系列之二-AIGC流量2月报解读:对话助手、 AI法律上涨,数字人高景气
查看原文
AI 通用对话 图 5:AI 办公助手
综合
2024-03-12
来源:TMT行业AIGC流量跟踪系列之二-AIGC流量2月报解读:对话助手、 AI法律上涨,数字人高景气
查看原文
各品类总月平均流量(单位:百万)
综合
2024-03-12
来源:TMT行业AIGC流量跟踪系列之二-AIGC流量2月报解读:对话助手、 AI法律上涨,数字人高景气
查看原文
AIGC 网站 2 月增速榜 图 2:AIGC 网站 2 月降速榜
综合
2024-03-12
来源:TMT行业AIGC流量跟踪系列之二-AIGC流量2月报解读:对话助手、 AI法律上涨,数字人高景气
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起