电子行业专题研究:Gemini能扭转谷歌在大模型竞争中的劣势吗
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 电子 Gemini 能扭转谷歌在大模型竞争中的劣势吗 华泰研究 电子 增持 (维持) 研究员 黄乐平,PhD SAC No. S0570521050001 SFC No. AUZ066 leping.huang@htsc.com +(852) 3658 6000 研究员 余熠 SAC No. S0570520090002 SFC No. BNC535 yuyi@htsc.com +(86) 755 8249 2388 联系人 权鹤阳 SAC No. S0570122070045 SFC No. BTV779 quanheyang@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2023 年 12 月 08 日│中国内地 专题研究 华泰观点:Gemini 能扭转谷歌在大模型竞争中的劣势吗 12/6,谷歌发布大模型 Gemini,在 Gemini Technical Report 中声称 Ultra版在绝大部分测试中优于 GPT-4,但目前只向用户开放性能较弱的 Pro(性能介于 GPT-3.5 和 GPT-4 之间)和 Nano(手机用)。当前北美大模型竞争格局逐渐明朗,微软+OpenAI 在商业化和用户认知度上领先一步,Meta 通过开源模型 LlaMa-2 吸引大量开发者,在大模型投入最早的谷歌却在模型能力、商业化、生态上都缺乏特色,谷歌采取逐步方式(Phased approach)提早发布 Gemini 或部分反映了公司面临的竞争压力。建议关注后续 Gemini和搜索、手机、云等主要业务如何结合,以及 Ultra 的发布进度。 Gemini:原生多模态模型,三个不同规模的模型适用不同场景 目前创建多模态模型时,往往分别训练不同模态的模型并加以拼接,Gemini 是原生多模态模型(文本、代码、音频、图像和视频),一开始就在不同模态上进行预训练,因此能够对输入的各模态内容顺畅地理解和推理,效果较优。Gemini 包括三个不同规模的模型:1)Ultra 是规模最大且功能最强大的模型,适用于高度复杂的任务。2)Pro 适用于各种任务的最佳模型。3)Nano 是端侧设备上最高效的模型。谷歌未公开 Gemini Ultra 及 Pro 的参数规模,仅公开了 Nano 拥有 1.8B、3.25B 参数的两个版本。 Gemini 生态:C 端落地 Bard、Pixel 手机、搜索等产品,B 端将推出 API 谷歌将在聊天机器人、手机等产品和服务中落地 Gemini:1)Bard 将使用Gemini Pro 的微调版本来进行更高级的推理、规划和理解等。2)Pixel 8 Pro是首款搭载 Gemini Nano 的智能手机,它可以支持录音应用中的“总结”等新功能,并在 Gboard 中推出“智能回复”功能,从 WhatsApp 开始,明年还将推出更多信息应用。3)未来几个月,Gemini 将应用于谷歌更多的产品和服务,如搜索、广告、Chrome 和 Duet AI。4)从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的Gemini API 获取 Gemini Pro。 Gemini Ultra:文本和推理能力略胜于 GPT-4,图像理解能力略胜于 GPT-4V 根据 Gemini Technical Report,Gemini Ultra 在 32 个基准中的 30 个基准中实现 SOTA,包括 12 个流行的文本和推理基准测试中的 10 个、全部 9 个图像理解基准测试、全部 6 个视频理解基准测试以及全部 5 个语音识别和语音翻译基准测试。与其他领先的大模型相比,Gemini Ultra 在绝大部分文本和推理测试中略胜于 GPT-4,在几乎所有多模态(图像、视频、音频)任务中略胜于 GPT-4V。Gemini Ultra 是第一个在 MMLU(大规模多任务语言理解)上超过人类专家表现的模型,MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目,可用于测试模型对于人类世界的知识储备和解决问题的能力。 谷歌发布下一代 TPU v5p Gemini 使用 TPU v5e 和 TPU v4 训练,谷歌此次同时发布下一代 TPU v5p。与 TPU v4 相比,TPU v5p 训练大语言模型快 2.8 倍,HBM 增加约 2 倍(95GB vs 32GB),单个 pod 芯片翻倍以上(8960 颗 vs 4096 颗)。我们认为基础大模型是少数玩家竞争的领域,算力、数据、算法缺一不可。 风险提示:AI 及技术落地不及预期;本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。 (15)(6)41322Dec-22Apr-23Aug-23Dec-23(%)电子沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 电子 图表1: 烹饪场景中用户输入图像和音频,获取制作蛋饼的指导,展示 Gemini 处理文本、视觉和音频交织序列的能力,以及跨模态推理的能力 资料来源:Gemini technical report,华泰研究 图表2: Gemini 能够正确识别学生手写答案并验证物理问题的推理过程 资料来源:Gemini technical report,华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 电子 图表3: Gemini Ultra 在绝大部分文本和推理测试中略胜于 GPT-4 资料来源:谷歌官网,华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 4 电子 图表4: Gemini Ultra 在几乎所有多模态任务中略胜于 GPT-4V 资料来源:谷歌官网,华泰研究 图表5: 谷歌 TPU v5p 与 v4、v5e 性能对比 资料来源:谷歌官网,华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 5 电子 风险提示 AI 技术落地不及预期。虽然 AI 技术加速发展,但由于成本、落地效果等限制,相关技术落地节奏可能不及我们预期。 技术开发进度不及预期。由于技术发展存在非线性,技术商业化存在一定不确定性,新技术开发、渗透进度可能不及预期。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 6 电子 免责声明 分析师声明 本人,黄乐平、余熠,兹证明本报告所表达的观点准确地反映了分析师对标的证券或发行人的个人意见;彼以往、现在或未来并无就其研究报告所提供的具体建议或所表迖的意见直接或间接收取任何报酬。 一般声明及披露 本报告由华泰证券股份有限公司(已具备中国证监会批准的证券投资咨询业务资格,以下简称“本公司”)制作。本报告所载资料是仅供接收
[华泰证券]:电子行业专题研究:Gemini能扭转谷歌在大模型竞争中的劣势吗,点击即可下载。报告格式为PDF,大小1.06M,页数8页,欢迎下载。



