AI行业跟踪点评-阿里通义千问:从模型到生态全方位领先
1 | 请务必仔细阅读报告尾部的投资评级说明和声明 行业点评 | 计算机 阿里通义千问:从模型到生态全方位领先 AI 行业跟踪点评 核心结论 行业评级 超配 前次评级 超配 评级变动 维持 近一年行业走势 相对表现 1 个月 3 个月 12 个月 计算机 -4.92 -11.59 -28.07 沪深 300 1.44 4.03 -5.59 分析师 郑宏达 S0800524020001 13918906471 zhenghongda@research.xbmail.com.cn 相关研究 计算机:从高通看端侧智能时代的到来—计算机行业周观点第 12 期 2024-05-26 计算机:端侧模型与操作系统的融合—计算机行业周观点第 11 期 2024-05-19 计算机:GPT-4o:人类在 AI 多模态大模型的进步,又迈上了新台阶— AI 行业跟踪点评 2024-05-14 从模型到应用,从技术能力到生态建设,阿里云在大模型时代全方位领跑。 · 基模型:通义千问 2.5 性能比肩 GPT-4 Turbo,在文档处理能力、音视频理解能力、代码编写等方面优势显著。2024 年 5 月 9 日,阿里云正式发布通义千问 2.5,在上海 AI 实验室推出的权威基准 OpenCompass 上的得分追平了 GPT-4 Turbo,是国产大模型中首个达到此成就的。 1) 文档处理能力:通义千问 2.5 支持单次最长 1000 万字、100 个文档,覆盖 PDF、Word、Excel 等多种文件格式,可解析标题、段落、图表等多种数据格式。 2) 音视频理解能力:通义千问 2.5 融合语音、LLM、多模态、翻译能力,具备实时语音识别、说话人分离功能,能够提取全文摘要、总结发言、提取关键词等,可同时上传处理 50 个音视频文件。 3) 智能编码:通义灵码掌握 Java、Python、Go、JavaScript、TypeScript、C/C++、C#等 200 多种编程语言,可以辅助写代码、读代码、查 Bug、优化代码等。 · 开源模型:阿里通义沿“全模态+全尺寸”路线前行,Qwen1.5-110B 超越 Llama-3-70B。通义推出参数规模横跨 5 亿到 1100 亿的八款大语言模型,小尺寸模型如 0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC 等端侧设备部署;大尺寸模型如 72B、110B 能支持企业级和科研级的应用;中等尺寸如 32B 试图在性能、效率和内存占用之间找到最具性价比的平衡点。其中,Qwen1.5-110B 在 MMLU、TheoremQA、GPQA 等基准测评中超越了 Meta的 Llama-3-70B 模型,在 Hugging Face 开源大模型排行榜 Open LLM Leaderboard 中登上榜首。 · 生态:IaaS+PaaS+MaaS 三位一体,在多个行业实现大模型商业化落地。 大模型服务平台百炼 2.0 实现模型到应用全链条打通,5 到 10 行代码即可搭建企业级 RAG 应用。2023 年 10 月,阿里云发布了百炼大模型平台,开发者可通过“拖拉拽”5 分钟开发一款大模型应用,几小时微调出一个专属模型。2024 年 5 月,阿里云发布更加易用、更加开放、引入更多模型的百炼2.0;同时针对企业最关注的 RAG 链路,提供灵活开放的企业级检索增强服务,5 到 10 行代码即能帮助企业搭建 RAG 应用。 根据阿里云数据,通义通过阿里云服务企业超过 9 万,通过钉钉服务企业超过 220 万,现已落地 PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。 风险提示:AI 技术突破不及预期、AI 商业化落地不及预期、宏观经济增长不及预期、国际环境变化。 -39%-31%-23%-15%-7%1%9%17%2023-052023-092024-01计算机沪深300证券研究报告 2024 年 05 月 27 日 行业点评 | 计算机 西部证券 2024 年 05 月 27 日 2 | 请务必仔细阅读报告尾部的投资评级说明和声明 通义大模型步履不停,不断缩短与国际头部大模型距离,通义千问 2.5 性能赶超 GPT-4 Turbo。2019 年,阿里达摩院开始投入大模型研发,在语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面做了许多探索;2022 年 10 月,阿里云在业界首次提出MaaS(模型即服务)理念,并发布 AI 模型社区“魔搭”。 2023 年 4 月,阿里云峰会上,“通义千问”正式发布; 2023 年 10 月 31 日,阿里云发布了通义千问 2.0 版本,综合性能超越了当时的 GPT-3.5。2024 年 5 月 9 日,阿里云发布通义千问 2.5,综合性能比肩 GPT-4 Turbo。相比上一版本,通义千问 2.5 的理解能力、逻辑推理、指令遵循、代码能力分别提升 9%、16%、19%、10%,其中中文语境下的文本生成和理解、 知识问答、生活建议、闲聊对话等垂直场景的能力更是赶超 GPT-4,成为中文社区最佳选择。在上海权威基准 OpenCompass 榜单上,通义千问 2.5 得分超越Claude 3 Opus,追平 GPT-4 Turbo,成为国产大模型首位。 图 1:通义千问迭代历程 图2:通义千问2.5在OpenCompass上的得分追平了GPT-4 Turbo 资料来源:阿里云微信公众号、西部证券研发中心 资料来源:机器之心微信公众号、西部证券研发中心 通义是开源大模型坚定践行者,推出参数规模横跨 5 亿到 1100 亿的 8 款大语言模型,以开放心态全面使能开发者,加速大模型应用落地。2023 年 8 月,通义宣布加入开源行列,沿着“全模态、全尺寸”开源的路线,陆续推出 8 款开源大语言模型;此外,通义还开源了视觉理解模型 Qwen-VL、音频理解模型 Qwen-Audio、代码模型 CodeQwen1.5-7B、混合专家模型 Qwen1.5-MoE。目前,通义开源模型下载量已经超过 700 万。 图 3:通义开源大模型矩阵 图 4:Qwen1.5-110B 模型在基础能力方面可对标 Llama-3-70B 资料来源:阿里云微信公众号、西部证券研发中心 资料来源:阿里通义千问微信公众号、西部证券研发中心 行业点评 | 计算机 西部证券 2024 年 05 月 27 日 3 | 请务必仔细阅读报告尾部的投资评级说明和声明 IaaS+PaaS+MaaS 三位一体,通义大模型生态逐步成形。 算力方面,灵骏智算集群与 PAI 平台共同构成了一个高性能、分布式的智能计算平台。阿里云的灵骏智算集群支持最高10万张卡的GPU规模,自研的高速RDMA链路达3.2Tbps,网络最低时延 1.5μs,并行存储吞吐量可达 20TB/s,能够同时训练多个万亿参数的大模型。同时,阿里云提供软硬件加速服务 PAI 机器学习平台,可以大幅提升 AI 开发和 AI 资源管理的效率, 大模型服务平台方面,百炼 2.0 助力企业实现模型开箱即用和快
[西部证券]:AI行业跟踪点评-阿里通义千问:从模型到生态全方位领先,点击即可下载。报告格式为PDF,大小0.97M,页数4页,欢迎下载。
