地球日记 · 2026年6月11日
装完刹车,Agent 开始值夜班
当 Agent 能被定时唤醒、后台执行并留下日志,任务设计、验收标准和异常处理会比提示词更重要。
上一篇我说,大厂都在给 Agent 装刹车。
这几天,故事的另一半来了:刹车装完,Agent 开始被排进后台值班表。
6 月 2 日,GitHub 给 Copilot cloud agent 上了 Automations。它可以定时运行,也能由新 Issue、PR 等仓库事件自动启动。分拣 Issue、夜间修测试、准备周报,都不必等人先发提示词。
6 月 4 日,Agent tasks REST API 开放。外部脚本可以启动任务、追踪进度,让 Agent 在独立云端环境里改代码、验证并提交 PR。
6 月 9 日,主打长时自主编码的 Claude Fable 5 进入 GitHub Copilot。同一天,GitHub 把 CodeQL、依赖漏洞和密钥扫描扩展到 Claude、Codex 等第三方 Agent。
6 月 10 日,Copilot Chat 开始能看见 Agent 状态、读取任务日志、搜索历史会话,并基于上次结果继续追问。
这些不是零散更新,而是一条清晰的产品路线:
触发任务 → 后台执行 → 自动验证 → 提交结果 → 留下日志 → 人类接管。
AI 编程正在从“我问它一次”,变成“系统在合适的时间叫醒它”。
这也解释了为什么上一篇讲的权限、隔离、日志、回滚突然变得重要。
刹车不是为了让 Agent 跑慢。
刹车是为了让它在你不盯着的时候,也敢继续跑。
协作重点正在变化
以后程序员和 Agent 协作,重点可能不再是反复改提示词,而是四件事:
- 定义什么情况触发任务。
- 限制它能动哪些资源。
- 设计结果如何验收。
- 规定异常时谁来接管。
OpenAI 介绍 Nextdoor 的实践时用了一个很准确的说法:从反复提示 Agent,转向“结果工程”。
提示词会越来越便宜。
真正变贵的,是任务设计、验收标准和异常处理。
Agent 不只是更会写代码了。
它开始有班表、有日志,也有下班前必须交付的结果。