2026年中国企业AI应用场景报告-极客时间

目录CONTENT企业端 AI 应用场景分析01重点行业分析02AI 应用的成功范式0301 企业端 AI 应用场景分析01多模态模型技术演变:开启原生模态整合2025 年多模态模型技术迎来突破性发展。长久以来,多模态模型的理解和生成技术发展相对独立,并形成了两种不同的架构探索路径。但2025年,我们看到了以GPT-5、Gemini3、 Bagel、VEO等开始探索统一理解和生成底座的多模态模型的迅速发展。同时我们也观察到了图像、语音、文字模态的技术路线的相对成熟,视频模态模型发展仍以视频理解和视频生成相对独立的技术发展路线为主。扩散与自回归混合统一的多模态模型路线 技 术 关 键 : 融 合 ⾃ 回 归 的 序 列 推 理 优 势与 扩 散 的 视 觉 ⽣ 成 优 势 , ⽂ 本 令 牌 ⾃ 回归 ⽣ 成 , 图 像 令 牌 多 步 去 噪 ⽣ 成 , 通 过双 向 注 意 ⼒ 或 共 享 ⻣ ⼲ ⽹ 络 实 现 跨 模 态融 合 , 平 衡 ⽂ 本 语 义 控 制 与 图 像 视 觉 保真 度 。 优 点 : 兼 顾 ⽂ 本 语 义 可 控 性 与 图 像 ⽣ 成质 量 ; ⽀ 持 复 杂 任 务 缺 点 : 架 构 复 杂 , 训 练 与 推 理 成 本 ⾼ ;模 态 融 合 难 度 ⼤ , 易 出 现 ⽂ 本 - 图 像 对⻬ 偏 差 ; 2 0 2 5 年 发 布 的 代 表 模 型 : M o g a o ( 字节 、 2 0 2 5 - 0 5 ) 、 B a g e l( 字 节 、2 0 2 5 - 0 5 )以扩散架构为主的多模态模型路线 技 术 关 键 : 以 扩 散 机 制 为 基 础 , 通 过 迭 代去 噪 过 程 实 现 ⾼ 质 量 图 像 ⽣ 成 , 同 时 融 ⼊多 模 态 上 下 ⽂ ( 如 ⽂ 本 、 图 像 嵌 ⼊ ) 实 现理 解 能 ⼒ 。 优 点 : 擅 ⻓ ⽣ 成 , ⽣ 成 图 像 质 量 ⾼ 、 细 节丰 富 ; 可 根 据 提 示 词 进 ⾏ 多 样 化 创 作 ( ⻛格 、 编 辑 等 ) ; 训 练 过 程 相 对 稳 定 。 缺 点 : 推 理 速 度 慢 、 部 分 模 型 训 练 时 学 习信 号 稀 疏 , 对 不 同 ⻓ 度 的 输 出 适 配 不 好 ;部 分 模 型 依 赖 外 部 框 架 , 开 源 ⽀ 持 有 限 。 2 0 2 5 年 发 布 的 代 表 模 型 : M M a D A( P U & P K U 、 2 0 2 5 - 0 5 ) 、 F U D O K I( H K U & 华 为 , 2 0 2 5 - 0 5 ) 、 M u d d it( P K U & 中 国 典 型 & N U S & P U 、 2 0 2 5 -0 5 )以自回归架构为主的多模态模型路线 技 术 关 键 : 基 于 L L M 的 ⾃ 回 归 架 构 , 将 图 像 转化 为 序 列 T o k e n , 通 过 预 测 下 ⼀ 个 T o k e n 的 ⽬ 标统 ⼀ 建 模 ⽂ 本 与 视 觉 模 态 。 优 点 : 和 ⼤ 语 ⾔ 模 型 结 构 相 通 , 能 灵 活 进 ⾏ 跨 模态 推 理 ; ⽀ 持 图 ⽂ 交 错 ⽣ 成 ( ⽐ 如 边 写 ⽂ 字 边 插图 ⽚ ) ; 部 分 模 型 ⽤ 连 续 令 牌 , 不 会 丢 失 图 像 原始 信 息 。 缺 点 : 模 态 对 ⻬ 依 赖 令 牌 器 质 量 , 设 计 难 度 ⾼ 。 2 0 2 5 年 发 布 的 代 表 模 型 : T o k L I P ( 腾 讯 A R C L a b & 中 科 院 ⾃ 动 化 所 等 、 2 0 2 5 - 0 5 ) 、S e lf t o k ( 华 为 、 2 0 2 5 - 0 5 ) 、 U n iT o k ( 字 节& C U H K 、 2 0 2 5 - 0 2 ) 、 U n iF o r k ( 上 海 A I 实验 室 、 2 0 2 5 - 0 6 ) 、 O m n iG e n 2 ( 北 京 ⼈ ⼯ 智能 研 究 院 、 2 0 2 5 - 0 6 ) 、 Q w e n - I m a g e ( 阿 ⾥ 、2 0 2 5 - 0 8 ) 、 M in g - O m n i( 蚂 蚁 、 2 0 2 5 - 0 6 )S k y w o r k U n iP ic ( 昆 仑 万 维 、 2 0 2 5 - 0 8 )趋势预测:原生全模态加速成型,世界模型迎来首轮技术收敛周期 我们预测,2026 年,原生多模态能力成为 AI 的标配,原生全模态模型加速落地,多模态理解与生成逐步融合。 世界模型技术路线迎来首轮收敛,跨模态统⼀底座开始形成,为具身智能、自动驾驶等应用的认知、推理与预测提供系统化基础。02040301形态1多模态模型不同模态信息训练不同的编 码器,统一翻译成文本模态 后,再通过文本整合输出形态2原生多模态模型能同步、原生地理解和生成 文本、代码、音频、图像和 视频等多模态输入形态4世界模型能够理解时间、空间规律, 并能对物理世界形成合理预 测形态3原生全模态模型不仅能够全模态理解,还能 全模态推理和输出超级智能体将成为产业落地与业务重构的真正执行者当下,多模态大模型作为企业 AI 应用的核心技术底座,在编程、医学诊断、心理咨询等多个领域,已经稳定超过大部分专业人士,智能不再是瓶颈;AI 不再只是被动回答的 Chatbot,而是具备能动性的超级智能体,会自己设定子目标、调用工具、协作完成任务。价值涌现效果涌现单模型在推理、写作、对话上的能力惊艳:会写代码、会写论文、会诊断、会聊天。但很多还停留在 Demo、效率工具层面:好看,好玩,但不一定好赚。当 AI Agent 渗透业务全流程、形成“数据 → 模型 → 决策 → 反馈”的闭环时,开始出现可量化的业务价值:知识资产变成企业新的“资产负债表科目”流程智能化成为新的核心竞争力,而不是简单“多一个工具”多 Agent 协同,让复杂业务可以被系统性拆解,比如金融领域的投研 Agent、风控 Agent、合规 Agent 共同工作,尽调周期缩短 风险评估更可追溯。背后依托的是 Agentic Infra / 智能体基础设施:沙箱 + 资源调度:上下文与记忆系统全链路可观测从单一模型能力的“效果涌现”,走向多智能体系统的“价值涌现”,超级智能体将成为产业落地与业务重构的真正“执行层”。当前通用聊天、通用创作类 AI 仍是企业端 AI 应用场景的主流24.70%20.80%18.20%2.60%3.90%2.60%1.30%1.30%24.70%百万级以下百万级千万级亿级十亿级百亿级千亿级千亿级以上不知道日均Token消耗量已搭建智能体平台71.40%未搭建智能体平台28.60%智能体平台落地占比 根据【2026年中国企业 AI 人才与组织发展报告】的数据显示,75.3%的企业有明确的 Token 消耗量感知,同时有71.4%的企业表示已搭建智能体平台,大模型在产业端

立即下载
综合
2026-04-03
30页
6.57M
收藏
分享

2026年中国企业AI应用场景报告-极客时间,点击即可下载。报告格式为PDF,大小6.57M,页数30页,欢迎下载。

本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
行业重仓股规模与环比增长率图4:前十大重仓股持仓规模情况
综合
2026-05-05
来源:2026Q1传媒行业持仓分析:重仓股配置比例继续大幅回落,前期高涨幅标的兑现,AI应用出现增配
查看原文
传媒行业配置与标配比例
综合
2026-05-05
来源:2026Q1传媒行业持仓分析:重仓股配置比例继续大幅回落,前期高涨幅标的兑现,AI应用出现增配
查看原文
图 15 专精特新小巨人企业参与制定标准类型结构
综合
2026-05-05
来源:2026全国专精特新小巨人画像
查看原文
表 4 参与制定国家标准数量 TOP20 企业名单
综合
2026-05-05
来源:2026全国专精特新小巨人画像
查看原文
图 14 专精特新小巨人企业授权发明专利省份分布
综合
2026-05-05
来源:2026全国专精特新小巨人画像
查看原文
表 3 授权发明专利数量 TOP20 企业名单
综合
2026-05-05
来源:2026全国专精特新小巨人画像
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起