人工智能行业动态:淘天联合爱橙开源强化学习训练框架ROLL,谷歌正式开源Gemma+3n

本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。 证券研究报告·行业动态 淘天联合爱橙开源强化学习训练框架ROLL,谷歌正式开源 Gemma 3n 核心观点 1. 淘天集团携手爱橙科技正式开源了全新一代强化学习训 练框架 ROLL,打通了从小模型到 600B+超大模型的 RL 训 练落地路径。ROLL 在诸如人类偏好对齐、复杂推理和多轮 自主交互场景等关键领域显著提升了大语言模型的性能,同 时具备超高的训练效率,目前 ROLL 已成功应用在多个淘天 集团内部业务场景,为业务创新提供了强大的技术支持。 2. 谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。Gemma 3n 代表了设备端 AI 的重大进步,其特性包 含:①多模态设计、专为设备端优化、架构突破(MatFormer 架构 )、质量提升。 产业要闻 【谷歌 DeepMind 发布可部署机器人的模型】 【腾讯 AI 发布了 SongGeneration 音乐生成大模型】 【地平线等单位提出 RoboTransfer 地平线】 【华为发布 CloudRobo 具身智能平台】 【小米汽车 Y07 正式上市】 【仁芯科技最新推出 32Gbps 车载显示 SerDes 芯片】 【三星计划发布新一代折叠屏手机】 【苹果 iPhone17 系列即将进入生产阶段】 【华为计划 9 月发布新款三折叠手机】 持续关注: GPU:英伟达、超威半导体、海光信息等; FPGA:安路科技-U 等; SoC:高通、全志科技等; 自然语言处理:科大讯飞等; 自动驾驶:德赛西威、中科创达、均胜电子; 智慧交通:千方科技; AI+工业:中控技术、华大九天、广立微等。 风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺 可能影响相关公司的正常生产和交付,公司出货不及预期。主要 原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企 业的汇兑收益与毛利率;人工智能技术进步不及预期;汽车与工 业智能化进展不及预期。 维持 强于大市 于芳博 yufangbo@csc.com.cn 010-56135159 SAC 编号:S1440522030001 SFC 编号:BVA286 发布日期: 2025 年 06 月 30 日 相关研究报告 -11%9%29%49%69%89%2024/7/12024/8/12024/9/12024/10/12024/11/12024/12/12025/1/12025/2/12025/3/12025/4/12025/5/12025/6/1计算机上证指数人工智能 人 工智能 行业动态报告 请务必阅读正文之后的免责条款和声明。 目录 一、行业变化......................................................................................................................................................................................... 1 二、持续关注标的................................................................................................................................................................................ 7 三、行情回顾......................................................................................................................................................................................... 7 四、产业要闻....................................................................................................................................................................................... 10 五、重要公告....................................................................................................................................................................................... 11 六、风险分析....................................................................................................................................................................................... 13 1 人 工智能 行业动态报告 请务必阅读正文之后的免责条款和声明。 一、 行业变化 1.1 淘天联合爱橙开源强化学习训练框架 ROLL 淘天集团携手爱橙科技正式开源了全新一代强化学习训练框架 ROLL(Reinforcement Learning Optimization for Large-scale Learning)。ROLL 以用户体验为核心设计理念,专为「高效・可扩展・易用」而打造,彻底 打通从小模型到 600B+超大模型的 RL 训练落地路径。ROLL 在诸如人类偏好对齐、复杂推理和多轮自主交 互场 景等关键领域显著提升了大语言模型的性能,同时具备超高的训练效率,目前 ROLL 已成功应用在多个淘 天集 团内部业务场景,为业务创新提供了强大的技术支持。 ROLL 是一款面向用户友好设计的强化学习框架。具体来说,ROLL 考虑三类用户诉求,即:技术先驱 者、产品开发者和算法研究者。对于技术先驱者:支持异构大规模 GPU 集群下的弹性扩展与容错,能够在 上千 卡环境下持续稳定地完成 600B+大模型训练,极大降低训练成本和中断风险。对于产品开发者:可灵活配置奖励函数、环境、采样比例与数据配比,轻松实现各种任务场景的 RL 训练落地。对于算法研究者:单卡/少卡资源下也能高效实验,所有模块高度抽象,极易实现自定义 RL 算法、奖励与环境,极大缩短从想法到验证的周期。

立即下载
信息科技
2025-07-07
中信建投
17页
3.16M
收藏
分享

[中信建投]:人工智能行业动态:淘天联合爱橙开源强化学习训练框架ROLL,谷歌正式开源Gemma+3n,点击即可下载。报告格式为PDF,大小3.16M,页数17页,欢迎下载。

本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 19 小米 AI 眼镜
信息科技
2025-07-07
来源:【策略月报】多行业联合人工智能7月报:AI与十五五规划
查看原文
图表 18 Marvell 芯片
信息科技
2025-07-07
来源:【策略月报】多行业联合人工智能7月报:AI与十五五规划
查看原文
图表 17 预计 23-28 年,定制化 XPU CAGR 为 47%,定制化 XPU attach CAGR 为 53%
信息科技
2025-07-07
来源:【策略月报】多行业联合人工智能7月报:AI与十五五规划
查看原文
图表 14 预计 28 年数据中心资本开支将超过 1 万亿美元 图表 15 新兴大型 AI 算力玩家正在快速崛起
信息科技
2025-07-07
来源:【策略月报】多行业联合人工智能7月报:AI与十五五规划
查看原文
图表 13 人工智能相关板块 PE 分位
信息科技
2025-07-07
来源:【策略月报】多行业联合人工智能7月报:AI与十五五规划
查看原文
图表 11 各板块成交热度
信息科技
2025-07-07
来源:【策略月报】多行业联合人工智能7月报:AI与十五五规划
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起