AI动态汇总:智元推出机器人世界模型平台Genie+Envisioner,智谱上线GLM-4.5V视觉推理模型-中邮证券
证券研究报告:金融工程报告 市场有风险,投资需谨慎 请务必阅读正文之后的免责条款部分 研究所 分析师:肖承志 SAC 登记编号:S1340524090001 Email:xiaochengzhi@cnpsec.com 研究助理:冯昱文 SAC 登记编号:S1340124100011 Email:fengyuwen@cnpsec.com 近期研究报告 《成长风格显著,中盘表现占优——中邮因子周报 20250817》 - 2025.08.18 《融资余额新高,创新药光通信调整,指数预期仍将震荡上行挑战前高——行 业 轮 动 周 报20250810 》 - 2025.08.11 《基本面因子表现不佳,小盘风格明显— — 中 邮 因 子 周 报 20250803 》 - 2025.08.04 《小市值占优,低波反转显著——中邮因子周报 20250727》 - 2025.07.28 《微盘股的流动性风险在哪?——微盘 股 指 数 周 报20250720 》 - 2025.07.21 《大金融表现居前助指数突破,GRU 行业轮动调入非银行金融——行业轮动周报 20250713》 - 2025.07.14 《低估值高盈利,基本面表现占优——中 邮 因 子 周 报20250706 》 - 2025.07.07 《基于宏观经济状态划分的 BL 模型与ETF 实践》 - 2025.07.01 《反转风格显著,小市值回撤——中邮因子周报 20250622》 - 2025.06.23 《关注基本面支撑,高波风格占优——中邮因子周报 20250615》 - 2025.06.16 《结合基本面和量价特征的 GRU 模型》 - 2025.06.05 金工周报 智元推出机器人世界模型平台 Genie Envisioner,智谱上线 GLM-4.5V 视觉推理模型——AI 动态汇总 20250818 ⚫ 智元推出机器人世界模型平台 Genie Envisioner 智元机器人于 2025 年 7 月 27 日在 WAIC 2025“智启具身论坛”上正式发布了行业首个动作驱动世界模型开源平台 ——Genie Envisioner(简称 GE),并于 8 月 14 日进一步向公众推出面向真实世界机器人操控的统一世界模型平台。这一平台彻底颠覆了传统机器人学习中“数据-训练-评估”割裂的流水线模式,创新性地构建了一个以视频生成为核心的闭环架构,使机器人能够在同一世界模型中完成从视觉感知到动作执行的端到端推理与执行。 ⚫ 智谱上线 GLM-4.5V 视觉推理模型 智谱 AI 于 2025 年 8 月 11 日正式发布并开源了新一代视觉推理模型 GLM-4.5V,该模型以 1060 亿总参数和 120 亿激活参数的规模成为全球 100B 级效果最佳的开源视觉推理模型,同步在 GitHub、Hugging Face 及魔搭社区开放下载。 ⚫ 字节 Seed 团队开源 VeOmni 全模态训练框架 字节跳动 Seed 团队于 2025 年 8 月 14 日正式开源的全模态PyTorch 原生训练框架 VeOmni,标志着多模态大模型训练进入“低摩擦时代”。该框架通过“以模型为中心”的分布式设计理念,系统性解决了传统训练方法在工程复杂度、扩展性和效率上的瓶颈,将全模态模型的研发周期从数周缩短至几天,工程耗时降低 90%以上,同时在128 卡 GPU 集群上实现 300 亿参数 MoE 模型 2800 tokens/sec/GPU 的吞吐量,支持高达 160K 超长上下文序列训练。 ⚫ 昆仑万维开源多模态框架 Skywork UniPic 2.0 昆仑万维于 2025 年 8 月 13 日在 SkyWork AI 技术发布周上正式开源了 Skywork UniPic 2.0,这是一款突破性的统一多模态框架,首次在单一模型中深度融合图像理解、文本到图像生成(T2I)和图像编辑(I2I)三大核心能力。该模型基于 2B 参数的 SD3.5-Medium 架构,通过创新的渐进式双任务强化策略和轻量化设计,实现了生成质量与部署效率的双重突破,其性能超越多个 12B 以上参数的同类模型,成为开源多模态领域的新标杆。 ⚫ 风险提示: 以上内容基于历史数据完成,在政策、市场环境发生变化时存在失效的风险;历史信息不代表未来。 发布时间:2025-08-25 请务必阅读正文之后的免责条款部分 2 目录 1 AI 重点要闻 .............................................................................. 4 1.1 智元推出机器人世界模型平台 Genie Envisioner ........................................... 4 1.2 智谱上线 GLM-4.5V 视觉推理模型 ........................................................ 6 1.3 字节 Seed 团队开源 VeOmni 全模态训练框架 ............................................... 9 1.4 昆仑万维开源多模态框架 Skywork UniPic 2.0 ............................................ 11 2 企业动态 ................................................................................ 13 2.1 阿里发布通义 Wan2.2-I2V-Flash 模型 ................................................... 13 2.2 昆仑万维上线音频模型 Mureka V7.5,并推 MoE-TTS 语音合成框架 ........................... 15 3 AI 行业洞察 ............................................................................. 17 3.1 阿里国际站 Accio Agent 海外爆火 ...................................................... 17 4 技术前沿 ................................................................................ 19 4.1 FlowReasoner: 增强查询级元智能体 .................................................... 19 5 风险提示 ........................................
AI动态汇总:智元推出机器人世界模型平台Genie+Envisioner,智谱上线GLM-4.5V视觉推理模型-中邮证券,点击即可下载。报告格式为PDF,大小1.98M,页数24页,欢迎下载。



