地球日记 · 2026年6月8日
别再问 AI 会不会写代码了,大厂都在给 Agent 装刹车
AI 编程进入第三阶段:重点从生成代码转向权限、日志、隔离、回滚和人类审查。
最近一个月,我发现 AI 编程的叙事变了。
以前大家都在问:AI 到底会不会写代码?
现在大厂真正关心的问题变成了:当 Agent 真的开始写代码、跑任务、接流程以后,谁来管它?
Anthropic 最近披露了一个很值得注意的数字:截至 2026 年 5 月,他们合并进代码库的代码里,超过 80% 由 Claude 生成。典型工程师的代码合并量,也已经是 2024 年的好几倍。
OpenAI 也在把 Codex 往完整软件交付生命周期里放:不只是写一段函数,而是进入需求、规格、开发、运维这些环节。
GitHub Copilot 在 VS Code 里推出 Agents 窗口,重点也不只是“补全代码”,而是让 Agent 处理更长的任务和多 session 工作流。
Microsoft Build 2026 更直接:Agent 365、Agent Registry、运行时隔离、审计、安全治理,全都摆上台面。
这说明一个很重要的变化:
AI 编程正在进入第三阶段
第一阶段,是让 AI 写代码。
第二阶段,是让 AI 组工程队。
第三阶段,是给 Agent 建制度。
这也和我前面几篇笔记连起来了。
CLAUDE.md 不是提示词,而是行为边界协议。Claude Code 强的不是聊天,而是一套可治理系统。Agent 的外骨骼,不在模型参数里,而在工具、记忆、中间件和可观测流程里。AI 工程队的核心,也不是更多 Agent,而是角色、流程和检查点。
所以现在真正热的,不是“哪个模型更会写代码”。
而是:
- 权限怎么给?
- 日志怎么留?
- 失败怎么回滚?
- 多个 Agent 怎么隔离?
- 人类在哪些节点必须审查?
写代码交给 AI,不等于责任交给 AI。
未来程序员最稀缺的能力,可能不是亲手写更多代码,而是能设计一套系统,让 AI 跑得快,但不要乱跑。
会写代码只是表象。
会给 Agent 装刹车,才是下一阶段的工程能力。