Harness Engineering 是控制论
作者: George (@odysseus0z) 来源: X/Twitter 日期: 2026 年 3 月 标签: cybernetics harness-engineering openai control-systems ai-engineering
核心观点
阅读 OpenAI 的 Harness Engineering 文章时,我一直有一种无法定位的感觉。然后我恍然大悟:我以前见过这种模式。不是一次——而是三次。
每次都是同一模式的再现:从手动控制到自动控制的转变。
第一次:瓦特调速器(1780年代)
在瓦特调速器之前,工人站在蒸汽机旁手动调整阀门。之后,一个加重的飞球机制感知转速并自动调整阀门。
工人没有消失。工作变了:从转动阀门变成设计调速器。
第二次:Kubernetes 控制器
你声明期望状态——三个副本、这个镜像、这些资源限制。控制器持续观察实际状态。当它们分歧时,控制器协调:重启崩溃的 pod、扩展副本、回滚错误的部署。
工程师的工作从重启服务转变为编写系统协调所依据的规范。
第三次:AI Agent 编程(现在)
OpenAI 描述了不再编写代码的工程师。相反,他们设计环境、构建反馈循环、编纂架构约束——然后 agent 编写代码。
一个完整的内部产品,零手写代码。他们称之为”harness engineering”(驯服工程)。
控制论的定义
诺伯特·维纳在 1948 年命名了它:控制论(cybernetics),来自希腊语 κυβερνήτης——舵手。
你停止转动阀门。你掌舵。
传感与执行
每次模式出现,都是因为有人构建了足够强大的传感器和执行器,可以在该层闭合循环。
代码库有反馈循环,但只在较低层级。编译器在语法上闭合循环。测试套件在行为上闭合循环。Linter 在风格上闭合循环。这些都是真正的控制论控制——但它们只适用于可以机械检查的属性。
它能编译吗?它能通过吗?它遵循规则吗?
所有高于这些的东西——这个更改是否适合系统架构?这是正确的方法吗?随着代码库增长,这个抽象会导致问题吗?——没有传感器和执行器。只有人类可以在那个层面上操作,在双方:判断质量和编写修复。
LLM 的突破
LLM 同时改变了这两者。它们可以在人类以前拥有的层面上感知,并在同一层面上行动:重构模块、重新设计不一致的接口、围绕实际重要的契约重写测试套件。
反馈循环首次可以在做出重要决策的地方闭合。
但闭合循环是必要的,不是充分的。瓦特的调速器需要调整。Kubernetes 控制器需要正确的规范。而在你的代码库上工作的 LLM 需要更难提供的东西。
让基本的反馈循环工作——agent 可以运行的测试、给出可解析输出的 CI、指向修复的错误消息——是赌注。
“我的大部分精力都花在设计 Claude 周围的环境上——测试、环境、反馈。”
更难的问题是用特定于你系统的知识校准传感器和执行器。这是大多数人被困住的地方,也是他们责怪 agent 的地方。
常见误区
“它一直做错事。它不理解我们的代码库。“诊断几乎总是错误的。
Agent 失败不是因为它缺乏能力。它失败是因为它需要的知识——对你的系统来说”好”意味着什么、你的架构奖励哪些模式、避免哪些模式——被锁在你的头脑中,你还没有外化它。
Agent 不通过渗透学习。如果你不写下来,agent 会在第 100 次运行时犯与第一次相同的错误。
工作的本质
工作是使你的判断机器可读。
- 描述实际分层和依赖方向的架构文档
- 内置补救说明的自定义 linter
- 编码你团队品味的”黄金原则”
OpenAI 的例子:他们每个星期五花 20% 的时间清理”AI slop”——直到他们将标准编码到驯具本身。
实践的重要性
这所需的实践——文档、自动化测试、编纂的架构决策、快速反馈循环——一直是正确的。过去三十年写的每一本工程书都推荐它们。
大多数人跳过它们是因为跳过的成本缓慢而 diffuse:渐进的质量下降、痛苦的上手、悄悄复合的技术债务。
Agent 工程使成本变得极端。跳过文档,agent 会忽略你的约定——不是在一个 PR 上,而是在每个 PR 上,以机器速度,全天候。跳过测试,反馈循环根本无法闭合。跳过架构约束,漂移复合得比你修复得更快。
这是陷阱:如果 agent 不知道干净是什么样子,你就不能使用 agent 清理混乱。没有校准,创造问题的机器也无法解决它。
实践没有改变。忽视它们的惩罚变得无法忍受。
生成-验证不对称
生成-验证不对称——Cobbe 等人背后的直觉——指向这走向何方。
生成正确的解决方案比验证一个更难。你不需要在实现上超越机器。你需要在评估上超越它:指定”正确”的样子,识别输出何时错过,判断方向是否正确。
结论
设计瓦特调速器的工人没有回去转动阀门。不是因为他们不能。而是因为不再有意义了。
相关资源
标签
cybernetics control-theory feedback-loops ai-agents kubernetes harness-engineering openai system-design