今天值得关注的 Agent 信号是:AI Agent 的使用方式正在从「手动调 Prompt」,迁移到「设计可执行、可验证、可恢复、可控成本的 Agent Loop」。
这个判断不是单点观察,而是由几条信号共同指向的。
OpenClaw 创作者 Peter Steinberger 最近提醒开发者:不要再把重点放在手动给编码 Agent 写提示词,而应该设计能够持续驱动 Agent 的循环。Claude Code 负责人 Boris Cherny 近期也分享了让 Claude Code / Claude Opus 更长时间自主运行的实践,包括自动权限、动态工作流、目标驱动、云端运行和端到端验证。Anthropic 官方也在 Claude Code 中推出了 auto mode,用独立的权限分类器减少频繁审批带来的中断,让 Agent 更适合处理长任务。
把这些信号放在一起看,趋势已经很清楚:
Prompt 仍然重要,但单点 Prompt 不再是 Agent 的核心杠杆。
过去,我们使用 Agent 的典型方式是:写一段 prompt,看 Agent 的运行 trace,发现跑偏,再补约束、改 prompt、重新跑。这个模式的问题是:人始终卡在循环中间。Agent 只是在帮你执行某一步,而不是独立完成一个可验证的任务闭环。
新的工作方式不是把 prompt 写得更长,而是搭建一套 Agent Loop:
目标定义 -> 任务拆解 -> 自动执行 -> 自动验证 -> 失败修复 -> 人工抽查 -> 产物沉淀
这也是近期很多 AI 工程实践反复指向的方向:真正拉开差距的,不是一次性提示词,而是围绕模型构建 harness、eval、feedback loop,让系统能够持续试错和改进。Daniel Demmel 在 “Feedback loop engineering” 中也提出,AI coding agent 的关键能力不是提示词本身,而是让它能在真实上下文里验证自己的工作。
但这里要避免一个误读:不是 Prompt 过时了,而是只靠人手工调 Prompt 的方式过时了。
未来的 Prompt 不会消失,而是会沉淀到更结构化的位置里:Goal Contract、CLAUDE.md / AGENTS.md、Skill、Command、Hook、权限规则、验收标准和任务模板。Prompt 从「聊天输入」变成了「系统配置」。
真正的专业分水岭,也不是你能同时拉起多少个子 Agent,而是你是否能让 Agent 自己证明:
我真的做对了。
没有自动验收,多 Agent 只是并行制造噪音。没有权限边界,自动执行就是风险放大器。没有成本控制,长循环就会变成 token 黑洞。Anthropic 在 Claude Code auto mode 文档中也明确提醒:auto mode 可以减少权限确认,但不等于替代人工 review,尤其不适合敏感任务、生产环境和高风险操作。
这也是软件工程界对 Agentic AI 的核心担忧:AI 正在压缩写代码的时间,但并没有消除需求定义、系统集成、测试验证、运维维护、责任归属这些更难的问题。VentureBeat 近期也在相关讨论中指出,AI 系统正在引入新的技术债,问题不只存在于代码里,也会隐藏在 prompt、模型和数据依赖之中。
所以,今天这个信号的本质不是:
Prompt Engineering 结束了。
而是:
Agent Engineering 开始了。
它要求我们从「会写提示词的人」,升级为「会设计工作系统的人」。
对 AI Native Builder 的启发
如果你正在用 Claude Code、Codex、Cursor、OpenClaw 或其他 Agent 工具,真正要优化的已经不只是 prompt,而是整个工作闭环。
最小可行的 Agent Loop 应该包括五个部分。
第一,Goal Contract。
每个任务开始前,先写清楚目标、边界、成功标准、禁止项和验收方式。不要只说「优化官网」,而要说「优化首页首屏表达,保持当前配色,不改信息架构,输出修改 diff 和理由」。
第二,Loop。
不要只让 Agent 做一次,而要让它执行、测试、修复、复测。Agent 的能力不是在一次回答里释放的,而是在多轮验证中释放的。
第三,Verification。
前端任务用浏览器检查,后端任务用测试和日志检查,移动端任务用模拟器检查。机器先验,人再抽查。没有自动验证,就没有真正的 Agent Loop。
第四,Permission。
自动权限可以提升吞吐量,但不能替代安全边界。生产环境、密钥、支付、数据库迁移、删除操作,必须保留人工审批。
第五,Cost Guardrail。
长任务必须设置 token、时间、重试和预算上限。Agent 能持续运行是能力,但不受控地持续运行就是风险。
可执行原则
1. 用 Goal Contract 替代随手 Prompt
任务不是一句话,而是一份可执行契约。目标、边界、验收标准越清楚,Agent 跑偏的概率越低。
2. 用 Loop 替代一次性执行
不要期待一次生成就是最终结果。让 Agent 自动执行、检查、修复、复测,才是真正的生产力释放。
3. 用自动验证替代人工盯 Trace
人不应该一直盯着 Agent 跑。人应该设计验收系统,让机器先判断是否完成,再由人做关键抽查。
4. 用权限护栏替代盲目信任
Auto mode 适合低风险、可回滚、可隔离的任务。高风险任务必须保留人工确认。
5. 用沉淀机制替代临时经验
跑通的流程不要留在聊天记录里,要沉淀成 Skill、Command、Hook、模板或 SOP。否则每次都要重新解释,Agent 的复利无法形成。
一句话总结
Agent 的下一阶段,不是更会写 Prompt,而是更会设计可执行、可验证、可恢复、可控成本的工作循环。
Prompt 是输入。
Loop 是生产线。
Eval 是质检。
Permission 是刹车。
Cost Guardrail 是预算。
只会写 Prompt,已经不够了。真正的竞争点,正在变成谁能设计更好的 Agent Loop。
参考链接
-
Peter Steinberger / OpenClaw 相关观点
https://x.com/steipete
https://digg.com/ai/7ifyvmb9 -
Claude Code Docs:Permission modes / Auto mode
https://code.claude.com/docs/en/permission-modes -
Claude Blog:Introducing dynamic workflows in Claude Code
https://claude.com/blog/introducing-dynamic-workflows-in-claude-code -
Daniel Demmel:Feedback loop engineering
https://www.danieldemmel.me/blog/feedback-loop-engineering -
VentureBeat AI:Agentic AI 与软件工程复杂度相关讨论
https://venturebeat.com/category/ai -
Anthropic:Claude Code / Auto Mode 相关说明
https://www.anthropic.com/engineering/claude-code-auto-mode