丰饶之后:AI Coding观察报告
V O L . 0 2 · 2 0 2 6T E N C E N T R E S E A R C H I N S T I T U T E · A I L E N SAI CODING · 2.0丰饶之后AI Coding 观察报告 2.02025H2 – 2026Q1腾讯研究院AI 透镜系列研究2026 年 4 ⽉CONTENTS目录开篇:9 个月后回望第一版 7 非共识验证 · 本版 6 个洞察速览301质变时刻两道能力门槛 · 五维证据 · METR 逆转602模型与驾驭工程趋同与分化 · 驾驭工程 · 协同进化1003工具生态的重塑Agent-First · CLI vs MCP · Skills1604当构建不再稀缺瓶颈迁移 · 原型墙 · 赛道消融2105格局与安全SaaS 重新分配 · 三种新攻击面 · 攻防对称2706面向未来角色转型 · 非开发者入场 · 就业流动 · 展望33附录验证对照表 · 关键时间线 · 术语表 · 参考文献38目录2PROLOGUE开篇:9 个月后回望From seven non-consensus questions to six structural insights.2025 年 7 月,腾讯研究院发布第一版《AI Coding 非共识报告》,提出 7 个行业非共识,判断 “AICoding 是通用 Agent 的先验战场”,将 “从 2,500 万开发者走向数十亿构建者” 作为愿景。9 个月后,这 7 条非共识的验证情况如下。01产品形态:本地 vs 云端🔄 三极并存:CLI / IDE / Cloud一版没有简单站队,而是用 “本地×云端 / 交互辅助×自主执行” 四象限切分出 IDE/插件、CLI、VibeCoding、异步 Coding Agent 四类,并把 CLI 单独称为 “进可攻退可守的通用潜力股”。9 个月后,这个判断兑现方式超预期:CLI 不只是通用,而是全面赢得开发者内循环(Claude Code 8 个月成为最受使用和喜爱的工具);IDE 继续在专业场景坚守并 Agent 化(Cursor 3、Google Antigravity、VSCode Multi-Agent);Vibe Coding 产品向设计等通用场景迁移;云端异步 Agent 则在“龙虾热”下将 IM 变为交互入口。四象限结构仍然成立,重心向 CLI 与异步侧迁移。02模型选择:自研 vs 第三方🔄 模型选择:趋同与分化一版的 “自研 + 第三方” 四象限仍是理解模型策略的基本框架,指出 “多模型策略 + 智能路由” 正在成为主流。9 个月后,原问题 “该选哪家模型” 已被更深层问题取代:六大商业模型 SWE-bench Verified 压缩到 1个百分点区间内,开源 Qwen3-Coder 追至 80% 段位。但 Anthropic 2026.4 同时发布 Mythos Preview(93.9%,不公开)与 Opus 4.7(87.6%,公开)的双轨机制表明,前沿实验室的能力储备与已公开模型之间正在拉开新的差距。03用户价值:提效 vs 降效✅ 已跨越争议期一版在这条上最审慎:同时摆出吴恩达 “效率提升至少 10 倍” 和 METR 随机对照实验 “AI 让开发者慢了19%”,让争议成为真正的非共识。9 个月后,METR 同批参与者在 2026.2 的后续实验中逆转为快 18%(CI-38% 到 +9%),30-50% 开发者拒绝 “无 AI” 条件。争议期已跨越,但一版埋下的测量论(“自我报告的时间节省与 PR 吞吐量指标之间存在脱节”)在 V2 谈 AI 生产力时仍然值得引用。开篇:9 个月后回望304付费模式:固定 vs 按需✅ 按需/信⽤制成为主流一版已明确判断 “混合模式 38% 超过订阅/席位制 36% 成为最主流”,指出 “传统 SaaS 的固定订阅模式在AI 高变动成本下出现结构性问题”。这条验证最彻底:所有主流产品(Cursor / Claude Code / Copilot /Devin / Replit Agent)都走向 Token / Credit / ACU(Agent Compute Unit)等抽象计费单元的按需或混合制。一个延伸判断:AI 的成本倒逼驾驭工程,每次 Agent 失败都是直接成本,这成为企业投资驾驭框架的直接商业理由。05企业态度:激进 vs 渐进✅ 两极分化加剧一版用 “从强制使用到进入绩效” 描述激进派路径,摆出 Dario Amodei “3-6 个月内 AI 写 90% 代码” 的最激进预测。9 个月后:微软、谷歌内部 AI 代码占比约 30%、Meta 未到 50%,Amodei 的 90% 没达成,但激进做法仍在扩散:Microsoft、Shopify 把 AI 使用计入绩效,Perplexity 的 “强制使用” 被更多公司采纳,Jellyfish 调研的 “仅 22.5% 有正式政策” 分化继续放大。一版的 “两极分化” 判断准确,加剧程度超预期。06组织影响:裁员 vs 扩张🔄 同时发⽣,不同技能层一版的关键数据(软件开发岗位仅为 2020.1 的 65%、初级岗位从 30% 降至 20%、高级岗位从 30% 升至40%、“10 人做 100 人的事”、1,000 万 ARR 规则被改写 Cursor 20 人 / 1 亿 ARR)9 个月后每条都被进一步印证。但也出现了一版未充分展开的新维度:AI 不是简单替代 N 个人,而是在拉高下限(非开发者进入构建)的同时提高上限(高级工程师杠杆放大)。Staff+ 工程师 63.5% 是最重度 Agent 用户,最有经验的人受益最多。07市场格局:专业 vs 普惠✅ “先验战场” 充分验证这是一版判断力最强的一条:Karpathy Software 1.0→2.0→3.0(code→weights→prompts)、“代码 ≠编程,意图将成为编程的核心驱动力”、Replit CEO Amjad Masad 的 “往下走 / 留在中间 / 往上走” 三象限,每一个框架 9 个月后都被广泛引用并进一步深化。Vercel 注册用户翻番、Cursor 36 万个人开发者、GitHub 个人仓库年增 217%,专业开发者没有被取代但角色重塑,非开发者正在以 “构建者” 身份进入软件生产。7 条非共识的验证汇聚到一个更深层问题:当这些争论尘埃落定之后,2026 年的 AI Coding 呈现出哪些真正的结构性图景?本版提炼为 6 个洞察,依次展开于下文六章。开篇:9 个月后回望4V2 · SIX INSIGHTS本版六个洞察Six structural insights for the AI coding landscape, 2026.❶模型加速趋同,前沿差距不减六大商业模型挤在 1 个百分点区间内;但 Opus 4.7 一次性 +6.8pp 跳升、Mythos Preview 更领先6.1pp——“内部突破 + 阶段性降权公开”的双轨发布机制正在形成。→ 第二章❷Agent 原生成为工具演化的收敛方向工具形态走向 Ag
[腾讯研究院]:丰饶之后:AI Coding观察报告,点击即可下载。报告格式为PDF,大小9.67M,页数41页,欢迎下载。



