软件与服务行业AI产业速递:Claude 4系列模型大幅提升自主编码能力,Agent走向下一程

请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业速递:Claude 4 系列模型大幅提升自主编码能力,Agent 走向下一程 报告要点 [Table_Summary]美国时间 5 月 23 日,Anthropic 正式发布 Claude 4 系列模型,包括 Claude Opus 4 和 Claude Sonnet 4 两款混合模型。其中,Claude Opus 4 是其发布的最高性能的编码模型,在复杂、长时间运行的任务和代理工作流上具有持续的性能。Claude Sonnet 4 是 Claude Sonnet 3.7 的重大升级,提供卓越的编码和推理,并且增强了可控性,从来更好地实施控制,提供功能和实用性的优质组合。该系列模型显著提升了 AI 的工具能力,核心提升了模型对工具使用、并行工具执行和进行扩展思考的能力,并且减少了模型使用快捷方式或漏洞完成任务的行为。 分析师及联系人 [Table_Author] 宗建树 SAC:S0490520030004 SFC:BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业速递:Claude 4 系列模型大幅提升自主编码能力,Agent 走向下一程 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 美国时间 5 月 23 日,Anthropic 正式发布 Claude 4 系列模型,包括 Claude Opus 4 和 Claude Sonnet 4 两款混合模型。其中,Claude Opus 4 是其发布的最高性能的编码模型,在复杂、长时间运行的任务和代理工作流上具有持续的性能。Claude Sonnet 4 是 Claude Sonnet 3.7 的重大升级,提供卓越的编码和推理,并且增强了可控性,从来更好地实施控制,提供功能和实用性的优质组合。该系列模型显著提升了 AI 的工具能力,核心提升了模型对工具使用、并行工具执行和进行扩展思考的能力,并且减少了模型使用快捷方式或漏洞完成任务的行为。 事件评论 ⚫ 新一代模型专为编码和代理任务设计,可自主编码长达 7h。公司模型类别一般可以分为Haiku(速度最快)、Sonnet(智能和速度取得平衡)和 Opus(最智能),上一代公司最智能的 Opus 模型 Claude Opus 3 在美国时间 2024 年 3 月 4 日发布,已经长达一年未更新。本次重磅发布 Claude Opus 4,该模型专为编码和代理任务设计,可自主编码完成人类需要长达 6-7 个小时才能完成的任务。在 SWE-bench(软件工程任务的性能基准)其得分为 72.5%,超越了 OpenAI Codex-1 的 72.1%、OpenAI o3 的 69.1%和 Gemini 2.5 Pro 的 63.2%;在 Terminal-bench(代理任务)其得分为 43.2%,明显高过 OpenAI o3 的 30.2%和 Gemini 2.5 Pro 的 25.3%。Claude Opus 4 模型在编码、推理、多模态功能和代理任务方面均有明显的性能提升,推动模型工具能力进一步跃升。Claude Sonnet 4 模型在 Sonnet 3.7 业界领先的功能基础上进行了显著提升,解决了 Sonnet 3.7 的过度积极的问题,并且在 SWE-bench 上达到了 72.7%的最高代码准确率。Opus 4 突破了编码、研究、写作和科学发现的界限,而 Sonnet 4 为日常用例带来了前沿性能。定价与之前模型保持一致,Opus 4 为 $15/$75 每百万 Tokens(input/output),Sonnet 4 为$3/$15。 ⚫ 发布并全面开放 Claude Code,Agent 进入自主阶段。Claude 3.7 可以自主工作约 45min不失去连贯性,Claude 4 可以突破数小时。Anthropiic 认为人工智能代理应该擅长三种能力,并以此为依据指定发展规划:(1)情景智能:理解你和你组织的独特背景,并不断从经验中学习,获取情景记忆和组织记忆;(2)长期执行能力:无需持续管理的情况下可处理复杂、耗时数小时的任务;(3)真正的协作:智能自主,与明确的检查点相平衡。Claude系列模型的升级给代理任务提升了更多探索的可能性。 ⚫ 多合作伙伴认可,Agent 迈入新阶段。Cursor 称其为最先进的编码技术,是复杂代码库理解的飞跃。Cognition 称 Opus 4 擅长解决其他模型无法解决的复杂挑战,成功处理了以前模型错过的关键行动。GitHub 宣布 Claude Sonnet 4 将作为支持 GitHub Copilot 中新编码代理的模型。Manus 也强调了它在遵循复杂指令、清晰推理等方面的提升。伴随模型能力提升,Agent 的适用场景有望不断扩张快速渗透,推荐关注 AI coding 板块的持续机遇,以及垂类场景下具有产品壁垒和数据壁垒的产品型厂商。 风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《AI 产业跟踪:“降低门槛、加速创造”,谷歌开启 AI 生态新时代》2025-05-26 •《美股量子标的异动,关注量子科技投资机遇》2025-05-25 •《六部门发布管理办法,关注网证相关投资机会》2025-05-25 -17%11%40%68%2024/52024/92025/12025/5软件与服务沪深300指数2025-05-26%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 看 好: 相对表现优于同期相关证券市场代表性指数 中 性: 相对表现与同期相关证券市场代表性指数持平 看 淡: 相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议

立即下载
信息科技
2025-05-27
长江证券
5页
0.57M
收藏
分享

[长江证券]:软件与服务行业AI产业速递:Claude 4系列模型大幅提升自主编码能力,Agent走向下一程,点击即可下载。报告格式为PDF,大小0.57M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图12 2021 年 5 月-2025 年 5 月笔记本面板价格(美元) 图13 2021 年 5 月-2025 年 5 月显示面板价格(美元)
信息科技
2025-05-26
来源:电子行业周报:小米发布自研玄戒双芯,华为鸿蒙电脑正式发布
查看原文
图11 2022 年 5 月 23 日-2025 年 5 月 23 日 TV 面板价格(美元)
信息科技
2025-05-26
来源:电子行业周报:小米发布自研玄戒双芯,华为鸿蒙电脑正式发布
查看原文
图9 2024 年 3 月-2025 年 3 月 NAND FLASH 合约平均价(美元)
信息科技
2025-05-26
来源:电子行业周报:小米发布自研玄戒双芯,华为鸿蒙电脑正式发布
查看原文
图8 2023 年 5 月 23 日-2025 年 5 月 23 日 DRAM 现货平均价(美元)
信息科技
2025-05-26
来源:电子行业周报:小米发布自研玄戒双芯,华为鸿蒙电脑正式发布
查看原文
图6 本周电子行业各子版块涨跌幅前三个股
信息科技
2025-05-26
来源:电子行业周报:小米发布自研玄戒双芯,华为鸿蒙电脑正式发布
查看原文
图5 申万三级细分板块周涨跌幅(%)
信息科技
2025-05-26
来源:电子行业周报:小米发布自研玄戒双芯,华为鸿蒙电脑正式发布
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起