Harness Engineering 是控制论

作者: George (@odysseus0z) 来源: X/Twitter 日期: 2026 年 3 月标签: cybernetics harness-engineering openai control-systems ai-engineering

核心观点

阅读 OpenAI 的 Harness Engineering 文章时，我一直有一种无法定位的感觉。然后我恍然大悟：我以前见过这种模式。不是一次——而是三次。

每次都是同一模式的再现：从手动控制到自动控制的转变。

第一次：瓦特调速器（1780年代）

在瓦特调速器之前，工人站在蒸汽机旁手动调整阀门。之后，一个加重的飞球机制感知转速并自动调整阀门。

工人没有消失。工作变了：从转动阀门变成设计调速器。

瓦特调速器

第二次：Kubernetes 控制器

你声明期望状态——三个副本、这个镜像、这些资源限制。控制器持续观察实际状态。当它们分歧时，控制器协调：重启崩溃的 pod、扩展副本、回滚错误的部署。

工程师的工作从重启服务转变为编写系统协调所依据的规范。

第三次：AI Agent 编程（现在）

OpenAI 描述了不再编写代码的工程师。相反，他们设计环境、构建反馈循环、编纂架构约束——然后 agent 编写代码。

一个完整的内部产品，零手写代码。他们称之为”harness engineering”（驯服工程）。

控制论的定义

诺伯特·维纳在 1948 年命名了它：控制论（cybernetics），来自希腊语 κυβερνήτης——舵手。

你停止转动阀门。你掌舵。

传感与执行

每次模式出现，都是因为有人构建了足够强大的传感器和执行器，可以在该层闭合循环。

代码库有反馈循环，但只在较低层级。编译器在语法上闭合循环。测试套件在行为上闭合循环。Linter 在风格上闭合循环。这些都是真正的控制论控制——但它们只适用于可以机械检查的属性。

它能编译吗？它能通过吗？它遵循规则吗？

所有高于这些的东西——这个更改是否适合系统架构？这是正确的方法吗？随着代码库增长，这个抽象会导致问题吗？——没有传感器和执行器。只有人类可以在那个层面上操作，在双方：判断质量和编写修复。

LLM 的突破

LLM 同时改变了这两者。它们可以在人类以前拥有的层面上感知，并在同一层面上行动：重构模块、重新设计不一致的接口、围绕实际重要的契约重写测试套件。

反馈循环首次可以在做出重要决策的地方闭合。

但闭合循环是必要的，不是充分的。瓦特的调速器需要调整。Kubernetes 控制器需要正确的规范。而在你的代码库上工作的 LLM 需要更难提供的东西。

让基本的反馈循环工作——agent 可以运行的测试、给出可解析输出的 CI、指向修复的错误消息——是赌注。

Andy Matuschak 让 16 个并行 agent 构建 C 编译器

“我的大部分精力都花在设计 Claude 周围的环境上——测试、环境、反馈。”

更难的问题是用特定于你系统的知识校准传感器和执行器。这是大多数人被困住的地方，也是他们责怪 agent 的地方。

常见误区

“它一直做错事。它不理解我们的代码库。“诊断几乎总是错误的。

Agent 失败不是因为它缺乏能力。它失败是因为它需要的知识——对你的系统来说”好”意味着什么、你的架构奖励哪些模式、避免哪些模式——被锁在你的头脑中，你还没有外化它。

Agent 不通过渗透学习。如果你不写下来，agent 会在第 100 次运行时犯与第一次相同的错误。

工作的本质

工作是使你的判断机器可读。

描述实际分层和依赖方向的架构文档
内置补救说明的自定义 linter
编码你团队品味的”黄金原则”

OpenAI 的例子：他们每个星期五花 20% 的时间清理”AI slop”——直到他们将标准编码到驯具本身。

实践的重要性

这所需的实践——文档、自动化测试、编纂的架构决策、快速反馈循环——一直是正确的。过去三十年写的每一本工程书都推荐它们。

大多数人跳过它们是因为跳过的成本缓慢而 diffuse：渐进的质量下降、痛苦的上手、悄悄复合的技术债务。

Agent 工程使成本变得极端。跳过文档，agent 会忽略你的约定——不是在一个 PR 上，而是在每个 PR 上，以机器速度，全天候。跳过测试，反馈循环根本无法闭合。跳过架构约束，漂移复合得比你修复得更快。

这是陷阱：如果 agent 不知道干净是什么样子，你就不能使用 agent 清理混乱。没有校准，创造问题的机器也无法解决它。

实践没有改变。忽视它们的惩罚变得无法忍受。

生成-验证不对称

生成-验证不对称——Cobbe 等人背后的直觉——指向这走向何方。

生成正确的解决方案比验证一个更难。你不需要在实现上超越机器。你需要在评估上超越它：指定”正确”的样子，识别输出何时错过，判断方向是否正确。

结论

设计瓦特调速器的工人没有回去转动阀门。不是因为他们不能。而是因为不再有意义了。

Product Hunter

探索

2026-03-12 - Harness Engineering Is Cybernetics - 控制论的视角