软件与服务行业AI产业速递(15):谷歌发布Gemini同架构模型Gemma,开源大模型能力再攀新高度
请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业速递(15):谷歌发布 Gemini 同架构模型 Gemma,开源大模型能力再攀新高度 报告要点 [Table_Summary]2024 年 2 月 21 日,谷歌开源 Gemini 同架构大模型 Gemma。该模型为一系列轻量级模型,目前发布了 2B 和 7B 两类规格,包括预训练和指令微调版本,能够直接在笔记本电脑或台式计算机上运行。该模型与 Gemini 共享技术与基础架构,使得 Gemma 2B 和 7B 与其他开放模型相比,展现出同等规模最先进的性能,助力开源大模型能力再攀新高度。 分析师及联系人 [Table_Author] 宗建树 SAC:S0490520030004 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业速递(15):谷歌发布 Gemini 同架构模型 Gemma,开源大模型能力再攀新高度 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 2024 年 2 月 21 日,谷歌开源 Gemini 同架构大模型 Gemma。该模型为一系列轻量级模型,目前发布了 2B 和 7B 两类规格,包括预训练和指令微调版本,能够直接在笔记本、电脑或台式计算机上运行,且支持商用。该模型与 Gemini 共享技术与基础架构,使得 Gemma 2B 和7B 与其他开放模型相比,展现出同等规模最先进的性能,助力开源大模型能力再攀新高度。 事件评论 与 Gemini 共享技术与基础架构,展现卓越性能优势。Gemma 与 Gemini 共享技术与基础架构。Gemma 2B 和 7B 分别以 2T 和 7T 的英文数据为基础训练,训练数据主要来自网页文档、数学、代码。与 Gemini 不同的是,模型并非为多模态模型,并未在多模态任务上进行训练。在通用能力、逻辑推理、数学、编程能力上,根据谷歌披露,Gemma 7B规模分数均大幅超过 Llama-2 7B 模型对应情况,甚至大部分测试分数高于 Llama-2 13B。 细致来看,通用/逻辑/数学/编程能力实现大幅跃升。Gemma 7B/Llama-2 7B/Llama-2 13B在通用能力中 MMLU 得分分别为 64.3/45.3/54.8;在逻辑 BBH(需要多步骤逻辑推理的挑 战 性 问 题 ) 得 分 分 别 为 55.1/32.6/39.4 , HellaSwag ( 常 识 问 题 ) 得 分 分 别 为81.2/77.2/80.7;数学能力中 GSM8K(基础数学问题,如小学数学)得分分别为46.4/14.6/28.7,MATH(挑战性数学问题)得分分别为 24.3/2.5/3.9,实现了大幅度跨越;编程能力中 HumanEval(Python 代码生成)得分分别为 32.2/12.8/18.3。 模型更加轻量,且提供多框架工具/支持多设备兼容/完成算力优化/支持商用,实用性大幅增强。相较于其他开源模型,Gemma 提供 :(1)多框架工具:提供包括 Keras 3.0、原生 PyTorch、JAX 和 Hugging Face Transformers 多个框架的参考实现,开发者可以直接选择熟悉的框架进行推理和微调;(2)跨设备兼容:可以在笔记本电脑、台式机、物联网、移动设备和云端等多个主流设备类型上运行,支持广泛的 AI 功能;(3)针对硬件完成优化:与 NVDIA 合作,并针对 GPU 对模型完成优化,同时支持 GPU 和 TPU 使用;(4)支持允许组织商业使用。以上工具和条款使得开源模型实用性进一步增强。 开源大模型王座之争加剧,促进开原生态应用发展。开源大模型领域王者原为 Meta,在谷歌加入竞争的背景下,Meta 最新开源大模型未来有望加速发布。目前开源大模型发展至今,模型可支持设备、优化所需工具进一步完善,模型能力持续跃升,有望催生更多应用场景爆发。例如,原受限于数学能力、场景精确度的场景有望进一步得到挖掘。建议关注 AI+教育、AI+办公、AI+金融、AI+医疗等板块的产品进展及投资机遇。 风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《移动智算中心招标,华为昇腾再成赢家》2024-02-19 •《关键词:七万亿算力投资、新一代大模型 2024年第 6 周计算机行业周报》2024-02-18 •《AI 产业速递(13):OpenAI 全新发布文生视频模型 Sora,AI+视频奇点时刻来临》2024-02-17 -39%-17%4%26%2023/22023/62023/102024/2软件与服务沪深300指数2024-02-22%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 7 行业研究 | 点评报告 目录 附录:模型及能力数据 ................................................................................................................. 4 风险提示 ....................................................................................................................................... 6 图表目录 图 1:与类似大小的开放模型相比,Gemma 7B 在不同功能上的能力表现 ................................................................. 4 图 2:具体各项能力分数对比 ....................................................................................................................................... 4 图 3:模型架构及参数情况 .......................................................................................................................................... 5 %%%%%%%%research.95579.com3 请阅读最后评级说明和重要声明 4 / 7 行业研究 | 点评报告 附录:模型及能力数据 图 1:与类似大
[长江证券]:软件与服务行业AI产业速递(15):谷歌发布Gemini同架构模型Gemma,开源大模型能力再攀新高度,点击即可下载。报告格式为PDF,大小0.62M,页数7页,欢迎下载。



