从鸟群到智能体:AI 系统的群聚规则
1986 年,克雷格·雷诺兹 (Craig Reynolds) 提出了一个听起来微不足道的问题:鸟类如何成群结队?不是一个哲学问题。工程类的。他想用计算机图形来渲染令人信服的鸟群,而不是为每只鸟的路径编写脚本。
他的回答使用了三个规则。分离:转向避免拥挤邻居。对齐:转向邻居的平均航向。凝聚力:转向邻居的平均位置。没有领导者,没有飞行计划,没有中央控制器。只需对每只鸟局部应用三个规则,就可以产生与真正的集群没有区别的全局协调。[^1]
四十年后,我管理了一个 multi-agent AI system,有 10 名专业代理人负责研究、辩论和对决策进行投票。第 23 晚,这些智能体在错误的问题上达成了完美的共识,我意识到我看到的是雷诺兹描述的相同的动态:简单规则的紧急协调,以及相同机制的紧急故障。
TL;DR
雷诺兹的鸟群模拟(boids)算法表明,三个简单的局部规则可以在无需集中控制的情况下产生连贯的全局行为。当规则选择良好时,遵循本地指令的代理(评估此代码、检查安全表面、审查此架构)会产生紧急协调,而当规则选择不当时,会产生紧急混乱。添加更多规则来修复边缘情况会使代理变得“更糟”,而不是更好。我的 23-agent runaway incident 证明了这一点:约束宽度(而不仅仅是深度)的生成预算相当于雷诺分离规则。
三法则,无限群
切换上面的规则看看会发生什么。当这三个人都活跃起来时,群体自然就会聚集起来。移除分离,它们就会塌陷成一团。移除对齐,它们就会分散成随机运动。消除内聚力,它们就会在保持局部航向的同时逐渐分开。每条规则都是必要的。单独一个是不够的。
Reynolds 在 1987 年的 SIGGRAPH 上将此称为“羊群、牛群和学校:分布式行为模型”。[^1] 这篇论文改变了计算机图形学。在群体出现之前,动画群体需要手写脚本的路径。在群体之后,群体就摆脱了规则。十多年后,1998 年,雷诺兹凭借这项工作获得了美国电影艺术与科学学院颁发的科学与工程奖。
更深层次的贡献并不是具体的规则。这证明全球协调不需要全球知识。每个机器人只知道它的近邻。没有人有羊群的地图。没有人知道羊群的目的地。羊群“没有”目的地。看似协调一致的运动实际上是产生全球模式的局部决策。
从像素到流程
从鸟群(boids)到人工智能代理的映射并不是隐喻性的。 NeurIPS 2025 研讨会论文《通过多智能体协作重新审视新兴智能的 Boids》明确将鸟群 (boids) 原则应用于多智能体系统。[^3] 该论文使用雷诺规则作为协作工具构建环境中智能体的自然语言指导:对齐和分离源自邻居的工具元数据,而内聚则注入上一轮的全局摘要。
我的映射更简单,来自阅读本文之前构建系统:
| 群体规则 | 代理当量 | 它可以防止什么 |
|---|---|---|
| 分离 | 生成预算:限制每个父级的活跃代理 | 代理在同一子问题上堆积 |
| 结盟 | 共享评估标准:所有代理人使用相同的证据标准 | 代理致力于不兼容的质量定义 |
| 凝聚 | 共识协议:智能体趋向于群体发现 | 特工陷入不相关的切线 |
平行并不完美。 Boids 规则是连续的(引导朝向平均航向)。代理规则是离散的(最多生成 12 个子代)。群体在空间坐标中运行。代理在问题空间中运行。但结构洞察力表明:每个智能体独立应用的局部规则会产生一致的群体行为。并且故障模式是相同的。
23 名特工在错误问题上达成一致的夜晚
2026年2月,我要求我的经纪人“调查改进挂钩调度系统”。代理评估自己的置信度为 0.58,这触发了 deliberation system。诞生了三名研究特工。每个人都发现了子问题并催生了自己的研究人员。这些特工产生了更多。
七分钟后:23 个活动代理进程。 4.80 美元的 API 积分。代币消耗以每分钟 0.70 美元的速度攀升。
递归保护跟踪深度(父级生成子级,子级生成孙级),但不跟踪宽度(父级生成 12 个子级,每个子级再生成 12 个)。深度限制 3 从未触发,因为代理是水平分布的。我手动杀死了这些进程。
每个代理商都同意挂钩调度系统需要改进。各代理商提出了合理的修改意见。没有一位特工质疑调查本身的范围是否正确。
结果展示了当你有凝聚力和一致性但没有分离时会发生什么。代理们趋向于相同的结论(凝聚力),并在相同的评估标准上保持一致(一致性)。但没有什么可以阻止他们集中解决同一个子问题。用雷诺兹的话来说,23 个物体占据了空间中的同一点,这是他的分离规则明确禁止的行为。
作为分离的生成预算
修复花了 20 分钟。生成预算,跟踪每个父项的活动子项总数,上限为 12.[^4] 宽度约束,而不仅仅是深度。
用 boids 的术语来说,生成预算就是分离规则:不要拥挤你的邻居。用代理术语来说:不要在一个子问题上放置超过 N 个代理,因为第 N+1 个代理会增加成本,但不会增加视角。 23特工事件告诉我,分离规则是三者中最重要的。没有它,一致性和凝聚力就会变得病态:代理人热情地聚集在同一个错误答案上。
正是出于这个原因,雷诺算法通常将分离力的权重比对齐或内聚力高 1.5-2 倍。[^1] 在我的系统中,hooks 强制生成预算(确定性,不受代理合理化影响),同时提示和上下文形状对齐和内聚(更柔软,可弯曲)。最严格的约束得到最严格的执行。
为什么更多的规则会让代理变得更糟
切换上面的鸟群模拟。现在想象一下添加第四条规则:“避开画布的中心”。第五种:“更喜欢上半部分。”第六种:“每 100 帧反转航向。”
每条规则都是单独合理的。他们一起消灭羊群。物体在竞争力量之间抖动,无法同时满足所有约束。优雅的植绒变成了噪音。
我在代理编排中观察到了相同的模式。我的审议系统的早期版本有详细的规则:最低研究深度、强制引用计数、需要反驳生成、强制魔鬼代言人通过。每条规则都改进了一些特定的失败案例。他们共同创建了花费更多代币来满足规则而不是解决问题的代理。
我记录的 compounding engineering philosophy 解释了为什么会在系统级别发生这种情况:每个新规则都会与每个现有规则交互,从而产生组合复杂性。十个规则不会产生十个约束。它们可能产生 45 种配对相互作用。系统的行为变得更难预测、更难调试,并且更有可能产生紧急故障。
雷诺兹的原始论文含蓄地理解了这一点。他将 boids 限制为三个规则,不是因为他无法想象更多,而是因为三个就足够了。添加第四个就需要重新平衡所有四个的权重,这个问题随着每次添加而呈指数级增长。
代理课程:从产生您想要的行为的最低规则开始。仅当您观察到现有规则无法解决的特定故障时才添加规则。当您添加规则时,请检查它是否会干扰其他规则。
创造结构的空虚
从简单规则中浮现出来的哲学维度与我的写作中意想不到的东西有关。
Nothing is structural。中央控制器的缺失并不是群体的限制。这就是架构。群体协调因为没有任何一只鸟拥有凌驾于其他鸟之上的权威。如果一只鸟成为领导者,系统就会变得脆弱,依赖于那只鸟的判断,很容易失败。
这同样适用于代理。我的审议系统之所以有效,因为没有任何一个代理人拥有否决权。每个代理人独立评估。共识协议汇总了他们的发现。如果一名特工制造了垃圾,其他特工就会投票压倒它。如果我添加一个具有超控权限的“首席代理”,我会重新引入我精心设计以消除的单点故障。
老子在同一篇文章中引用了这句话:“将其中的无内容调整到手头的目的。”[^5] boids 算法中的空白空间(缺乏中央控制)是使紧急协调成为可能的结构元素。
其他领域的涌现模式
“简单的规则,紧急的行为”模式并不是 boids 或智能体所独有的。它出现在本地决策聚合到全球结构的任何地方:
Hamming codes 展示了一种相关的涌现形式。将奇偶校验位战略性地放置在 2 的幂位置上会创建一个系统,其中错误的位置出现是通过对所有“1”位的位置进行异或运算而产生的。没有人知道错误出在哪里。错误位置从结构中显现出来。孤立的单个奇偶校验位几乎无法告诉您任何信息。正确位置的多个奇偶校验位可以告诉您一切。
Conway’s Game of Life 根据应用于网格的四个规则生成滑翔机、振荡器和图灵完备计算。这些规则比 boids 更简单(如果一个细胞有 2-3 个邻居,那么它就存活,否则就会死亡)。出现的复杂性是无限的。
在每种情况下,模式都是相同的:地方规则,没有中央协调员,紧急的全球行为。在每种情况下,都会出现相同的故障模式:添加太多规则,系统就会从优雅的出现崩溃到混乱的干扰。
要点
对于设计多代理系统的工程师:
-
三个规则产生聚集。四个规则可能不会。 雷诺兹的见解是,三个精心选择的规则足以进行紧急协调。添加第四个会产生干扰,从而破坏前三个产生的行为。从产生您想要的行为的最低规则开始。
-
分离是最重要的规则。 如果没有它,一致性和凝聚力就会变得病态,代理人会聚集在相同的错误答案上。 spawn budget(宽度约束)是我对多代理系统所做的最有影响力的单一更改。
对于构建分布式系统的架构师:
-
架构缺乏领导者。集中控制会造成单点故障。通过地方规则进行的分散协调更具弹性。设计您的代理系统时不要使用“首席代理”,除非您有特定原因要添加一个。
-
更多规则创建更多交互。 N 个规则产生最多 N(N-1)/2 成对交互。每添加一次,行为就会变得更难预测。仅当您观察到现有规则无法解决的特定故障时才添加规则。
Interactive Explorations 系列的一部分,算法满足视觉直觉:从 Hamming codes that catch their own mistakes 到没有领导者的群体。代理编排模式详细显示在 The Ralph System 和 Multi-Agent Deliberation 中。 metacognitive programming layer 增加了个体代理自我监控,以补充上述代理间协调。
[^1]:雷诺兹,C.W. (1987)。 “羊群、牛群和学校:分布式行为模型。” SIGGRAPH ‘87:第 14 届计算机图形和交互技术年度会议论文集,第 25-34 页。 red3d.com/cwr/boids/
[^2]:雷诺兹于 1998 年获得美国电影艺术与科学学院颁发的科学与工程奖,以表彰他在 boids 工作的基础上对行为动画做出的贡献。自“蝙蝠侠归来”(1992 年)以来,该算法一直用于电影制作。 oscars.org/sci-tech/ceremonies/1998。另请参阅雷诺兹的简历:red3d.com/cwr/resume.html。
[^3]:“通过多智能体协作重新审视新兴智能的 Boids。” NeurIPS 2025 研讨会:扩展环境。 openreview.net/pdf?id=46LJ81Yqm2。该论文应用 boids 规则作为遵循观察-反映-构建循环的代理的自然语言指导。
[^4]:生成预算实施记录在 The Ralph System 中。关键的架构决策:通过挂钩(确定性)而不是提示(建议性)强制宽度限制。被指示“限制生成”的特工将合理化超过限制。计算活动子级并阻止生成 API 调用的钩子则不能。
[^5]:老子,《道德经》,第 11 章。译文:理雅各。整篇文章讨论了轮子的轮毂、房间的墙壁和容器的粘土:三个例子,实用性来自虚空,而不是材料。请参阅 Nothing is Structural 进行完整探索。