人类工作流与AI对齐

最近和虎王聊到公司、复杂系统、上下文与 AI 对齐,都是些碎片想法,但有个点一直在脑子里转:为什么人类的协同规范这么适合迁移到 AI 的工作流里?

这个感觉在 demoday 上变得更清晰了。赵纯想分享他在 AI coding 的流程里加入了「工作留痕」——让 AI 能回溯”我为什么这么改代码”。我当时就觉得,这不就是软件工程里的 commit message 吗?本来是给团队成员看的,现在变成给 AI 看的。

然后又看到「spec coding」这个新概念——词造得太快了,我还特地查了下,发现其实就是在写代码之前先写 PRD、做版本管理。某种程度上,这就是产品经理和工程师对齐需求的那套东西,现在变成了和 AI 对齐意图的工具。

但真正让我意识到这件事的是最近在学纯想老师的 vibe coding 课程。其中有一部分讲如何从成熟网站里把 UI「抽骨吸髓」并用到自己的网站上,关键就是设计系统。我发现这个设计系统几乎和 UI 总监维护的组件化规范长得一模一样——什么场景用什么按钮、间距多少、颜色如何搭配。这些规范本来躺在设计师的脑子里,但设计系统把它们「固化」成了可复用的代码和文档。

事实上,设计系统最早解决的不是 AI 的问题,而是人和人之间的协同问题。一个团队有十几个设计师,如果没有统一规范,每个人做出来的界面都不一样。设计系统的作用是让所有人「对齐」:看到同一个组件,理解同一套规则,输出一致的结果。

换句话说,设计系统的本质不是「设计」,而是对齐。它把隐性的审美判断变成显性的规范,让不同的大脑能够同步。


文风系统

我举一反三,特地做了个「文风系统」。

收集了自己写的 391 条短想法和 10 篇长文,统计了转折词频率、段落长度、类比偏好、结尾习惯——甚至精确到”我用’但’的频率是 3.11 次/千字,从不用’然而’”。然后把这些数据整理成一套规范,喂给 AI。

结果是,我只需要写一些大纲和碎碎念,AI 就能完美直出我的语言风格和口气,没有 few-shot 的过拟合问题。某种程度上,这和设计系统干的事一模一样:把一个人脑子里的隐性知识——这里是写作习惯——翻译成一套 AI 可读的规范。

但这次的「对齐」对象变了。不再是人和人之间的审美统一,而是人和 AI 之间的意图同步。


隐性知识的传递

问题在于,为什么这些本来用于人类协同的规范,能无缝迁移到 AI 上?

事实上,人类的协同规范从来不是为了「协同」而设计的,而是为了解决隐性知识的传递问题

你去看建筑行业的图纸标注——墙体多厚、钢筋怎么排、水电怎么走——这些规范不是为了让图纸好看,而是为了让设计师脑子里的三维结构能够被施工队准确还原。设计师不可能跑到工地上盯着每一块砖,所以他需要把自己的意图「编码」成标准化的符号,让看懂符号的人能够「解码」出同样的建筑。

再看厨房里的 mise en place(备菜系统):所有食材提前切好、摆放到固定位置。这不是强迫症,而是因为高峰期没时间思考”洋葱在哪”——厨师需要把「记忆」外置到空间布局上,让手的肌肉记忆直接接管大脑。

还有三审制——编辑、校对、终审三层把关。这套规范的本质是把「质量标准」拆解成可执行的检查清单,让不同角色在不同阶段各司其职。

换句话说,所有这些协同规范的底层逻辑都是一样的:把一个人的隐性知识变成显性的、可传递的、标准化的规范,让另一个主体(人或机器)能够准确理解和执行。

某种程度上,这就是「大脑对齐」的过程。


意图编码系统

这个视角解释了为什么那些规范能迁移到 AI 上。

工作留痕、spec coding、设计系统、文风系统——它们之所以能迁移,是因为人和 AI 在协同时面临的问题是相似的:如何让一个主体理解另一个主体的意图,并按预期执行。

但这里有个反直觉的点:AI 不需要「学习」这些规范,而是需要「被告知」这些规范。

人类学设计系统,需要理解为什么这个按钮是圆角、为什么这个颜色是主色——需要消化背后的设计哲学。但 AI 不需要。你直接告诉它”这个场景用这个组件”,它就能精确执行。

某种程度上,AI 更像是一个极度服从的实习生:不会质疑你的决策,不会偷懒简化流程,但也不会自己领悟你没说出口的潜台词。所以你需要把所有隐性的判断都显性化——这恰好就是协同规范在做的事。

换句话说,人类几千年来发展出的协同规范,本质上是一套「意图编码系统」。只是以前的解码器是人,现在多了一个选项:AI。


我不由得想到,人类的协同规范还有很多:法律条文、乐谱、象棋棋谱、手术操作指南……每一套规范背后,都是某个领域的专家把自己的隐性知识「对齐」给后来者的尝试。

如果这些规范都能迁移到 AI 上,会发生什么?

总感觉这里面还有更多惊喜。