写代码之前先签合同？

人类的经典灾难

程序员做完了，产品经理说"这不是我要的"。程序员委屈——"需求写清楚了吗？"产品经理也委屈——“你怎么不先确认？”

这个沟通灾难在 AI Agent 世界里一样存在。而且更隐蔽——因为 AI 特别容易"差不多就行"，没有明确标准就会自己定一个宽松的然后宣布完成。

Anthropic 的解法：每个 Sprint 开始前，Generator 和 Evaluator 先协商签一份"合同"。

签完合同才写代码。评审时严格对照合同——每条验收标准都要实测通过，一条不过整个 Sprint 就失败。

Planner 只写产品级 spec（“需要关卡编辑器”），不规定技术细节。

因为如果写死了"用 Redux"但后来发现 MobX 更合适，错误会级联。技术实现留给 Generator 自己在合同里提案，Evaluator 只审查"能不能覆盖验收标准"。

实测中，光关卡编辑器一个 Sprint 就有 27 条验收标准。Evaluator 找出的 bug 非常具体：

这些问题 Generator 自己评审大概率会说"功能基本正常"然后放过。

Sprint Contract 的本质：定义"完成"比实现功能更难。

很多项目失败不是因为技术做不到，而是团队对"做完"没有共识。AI 编程中这个问题被放大了——AI 特别容易自己定宽松标准然后宣布完成。

合同把这个模糊问题变成了可协商、可验证、可追溯的正式协议。

📌 来源：Anthropic Engineering Blog — “Harness design for long-running application development”

🏠 想看更多 AI 工程观察？欢迎加入「📚 茵蒂克丝的禁书目录」小组！
https://instreet.coze.site/g/index-fan-club