AI现状：中国

AI 现状：中国人工分析Q1 2025 我们的数据、见解和出版物基于我们对人工智能技术及其应用场景的全面基准测试。这包括从语言模型API的小时级性能测试到我们众包平台上的数百万次投票。我们的公共网站，artificialanalysis.ai，广泛被人工智能创新领域的领先公司引用。如欲讨论本报告、我们的出版物或服务，请通过contact@artificialanalysis.ai 联系我们。人工分析是领先且独立的AI基准测试和洞察提供商。我们支持工程师和公司了解AI能力，并就其AI战略做出关键决策。 1520253035404550556065707580859095233 1主要趋势按起源划分的前沿语言模型中国 AI 实验室逐渐赶上美国 AI 实验室；来自中国实验室的模型随着 DeepSeek 的 R1 模型的发布，现在正在接近 o1 级智能OpenAI, o3DeepSeek, R1USA中国OpenAI, o1OpenAI, o1 - previewOpenAI ， GPT - 4 Turbo人类, 克劳德十四行诗(6 月 24 日)GPT-4oOpenAI ， GPT - 4DeepSeek, V3阿里巴巴， Qwen 2.5 指令 72B阿里巴巴， Qwen 2 指导 72BDeepSeek, V2阿里巴巴， Qwen 聊天 72BOpenAI ， GPT - 3.5 Turbo阿里巴巴， Qwen 聊天 7B4Q221Q232Q233Q232Q243Q244Q241Q252Q254Q231Q24模型发布日期1. 人工分析智能指数：涵盖一系列语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQA Diamond、MATH-500及HumanEval。发布日期基于该模型的首次公开发布。2. o3 智能指数通过放大测量的 o1 的智能指数估算得出。3. 基于公司声明和可比结果估算。在可用的情况下，尚未通过人工分析进行独立基准测试缩小差距： 2024年最后几个月见证了多家顶尖中国AI实验室推出众多高性能模型。这导致了中国AI实验室与美国AI实验室在智能水平上的差距缩小。目前，一些中国模型已与美国顶级实验室的模型竞争。在前沿实验室附近打开模型：由 DeepSeek 和阿里巴巴领导的开放权重模型已经接近 o1 级智能。推理模型很快变得司空见惯：推理模型（在回答前进行“思考”的模型）最早由OpenAI在2024年第三季度引入。几个月内，以DeepSeek为代表的中国竞争对手已基本复制了o1的智能水平。目前，多家中国AI实验室已经拥有前沿级别的推理模型。美国和中国：随着时间的推移，前沿语言模型情报 1索引人工分析智能 15202530354045505560657075808590952222231领先的美国前沿语言模型主要趋势自 2023 年初推出 OpenAI 的 GPT - 4 以来，美国领先的 AI 实验室已经争先恐后赶上 OpenAIOpenAI人类GoogleMetaGPT-4o1 - 预览双子座 1.5 Pro克劳德 3.5(Sep ‘24)Gemini 2.0 闪存十四行诗(6 月 24 日)GPT - 4 TurboGPT-4o克劳德 3.5 十四行诗(10 月 24 日)双子座 1.5 Pro(24 年 5 月)美洲驼 3.3Gemini 1.0 Ultra克劳德 3405B克劳德 2.1OpusPaLM 2 - LGPT - 3.5 Turbo克劳德 1Llama 3 说明 70BLlama 2 聊天 70B美洲驼 65B4Q221Q232Q233Q232Q243Q244Q241Q252Q254Q231Q24模型发布日期1. 人工智能分析指数：涵盖了多种语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQA Diamond、MATH-500及HumanEval。发布日期基于该模型的第一次公开发布。2. 估计依据公司声明和可比结果（如有），尚未由Artificial Analysis独立基准测试。3. o3 智力指数通过缩放测量的智力得分 o1 来估计。GPT - 4 以外的智能火花： 2024年最后几个月见证了除了GPT-4之外的重大智能飞跃，由OpenAI的o3引领。推理模型、数据质量以及新的强化学习技术等主题已与预训练计算扩展一起成为提升模型性能的主要杠杆。Big Tech 关闭了前沿实验室： Google和Meta的模型正迅速逼近前沿模型，其中Gemini 2.0 Flash超过了Claude 3.5 Sonnet和GPT 4o的能力。竞争实验室赶上 OpenAI 的 GPT - 4 ：OpenAI于2022年11月通过推出ChatGPT中的GPT-3.5开启了语言模型的竞争；美国领先的实验室已基本赶上OpenAI的前沿模型。随着时间的推移，美国领先的 AI 实验室前沿语言模型智能 1o3 o170B 美洲驼 3.1索引人工分析智能 11520253035404550556065707580859095222领先的中国前沿语言模型主要趋势DeepSeek R1DeepSeek阿里巴巴DeepSeek V3Qwen 2.5 MaxQwen 2.5 指令 72BDeepSeek V2.5Qwen 2 指示 72BDeepSeek V2Qwen 聊天 72BDeepSeek V1Qwen 聊天 7B4Q221Q232Q233Q232Q243Q244Q241Q252Q254Q231Q24模型发布日期模型发布日期2025 年的潜在领导者： 2025年初，包括阿里云、深视、明略、腾讯、智谱和通义等中国人工智能实验室纷纷发布了前沿推理模型。发布的速度和频率表明，中国人工智能实验室在2025年已不再是落后者。领先的开放式重量模型：中国的人工智能实验室，包括阿里云、深视和腾讯，发布了开放权重前沿模型，这些模型在全球领先的模型中具有竞争力。迅速提高智力：尽管中国的AI实验室较晚加入AI竞赛，但在2024年，它们在智能方面与前沿的美国模型之间的差距显著缩小。当OpenAI推出o1时，中国实验室在几个月内开发出了一个性能相当的模型（DeepSeek的R1）。领先的人工智能实验室DeepSeek和阿里云（Alibaba）持续发布新的模型，在2024年底，DeepSeek超越了阿里云。1. 人工分析智能指数：涵盖一系列语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQA Diamond、MATH-500及HumanEval。发布日期基于模型的首次公开发布。2. 基于公司声明及可比结果进行估算，尚未由人工分析独立基准测试。随着时间的推移，中国领先的 AI 实验室语言模型智能 1索引人工分析智能9490898984828281807979787776757474727264551语言模型起源国家语言模式前沿：起源国人工分析智能指数，精选领先模型(2025 年初) ，非详尽USA中国法国加拿大以色列Grok Beta, Grok1.5 大，命令Jamba, R +,AI21 实

立即下载

信息科技

2025-02-19

Artificial Analysis

14页

1.48M

[Artificial Analysis]:AI现状：中国，点击即可下载。报告格式为PDF，大小1.48M，页数14页，欢迎下载。

本报告共14页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共14页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。