← 所有文章

從鳥群到智能體:AI 系統的群聚規則

1986 年,克雷格雷諾茲 (Craig Reynolds) 提出了一個聽起來微不足道的問題:鳥類如何成群結隊?不是一個哲學問題。工程類的。他想用電腦圖形來渲染令人信服的鳥群,而不是為每隻鳥的路徑編寫腳本。

他的回答使用了三個規則。分離:轉向避免擁擠鄰居。對齊:轉向鄰居的平均航向。凝聚力:轉向鄰居的平均位置。沒有領導者,沒有飛行計劃,沒有中央控制器。只需對每隻鳥局部應用三個規則,就可以產生與真正的群集沒有區別的全局協調。 [^1]

四十年後,我管理了一個 multi-agent AI system,有 10 名專業代理人負責研究、辯論和對決策進行投票。在第 23 晚,這些智能體在錯誤的問題上達成了完美的共識,我意識到我看到的是雷諾茲所描述的相同的動態:簡單規則的緊急協調,以及相同機制的緊急故障。

TL;DR

雷諾茲的鳥群模擬(boids)演算法表明,三個簡單的局部規則可以在無需集中控制的情況下產生連貫的全局行為。當規則選擇良好時,遵循本地指令的代理(評估此程式碼、檢查安全表面、審查此架構)會產生緊急協調,而當規則選擇不當時,會產生緊急混亂。添加更多規則來修復邊緣情況會使代理變得“更糟”,而不是更好。我的 23-agent runaway incident 證明了這一點:約束寬度(而不僅僅是深度)的生成預算相當於雷諾分離規則。


三法則,無限群

切換上面的規則看看會發生什麼事。當這三個人都活躍起來時,群體自然就會聚集起來。移除分離,它們就會塌陷成一團。移除對齊,它們就會分散成隨機運動。消除內聚力,它們就會在保持局部航向的同時逐漸分開。每條規則都是必要的。單獨一個是不夠的。

Reynolds 在 1987 年的 SIGGRAPH 上將此稱為「羊群、牛群和學校:分散式行為模型」。 [^1] 這篇論文改變了電腦圖形。在群體出現之前,動畫群體需要手寫腳本的路徑。在群體之後,群體就擺脫了規則。十多年後,1998 年,雷諾茲憑藉這項工作獲得了美國電影藝術與科學學院頒發的科學與工程獎。

更深層的貢獻並不是具體的規則。這證明全球協調不需要全球知識。每個機器人只知道它的近鄰。沒有人有羊群的地圖。沒有人知道羊群的目的地。羊群「沒有」目的地。看似協調一致的運動其實是產生全球模式的局部決策。


從像素到流程

從鳥群(boids)到人工智慧代理的映射並不是隱喻性的。 NeurIPS 2025 研討會論文《透過多智能體協作重新檢視新興智能的 Boids》明確地將鳥群 (boids) 原則應用於多智能體系統。 [^3] 該論文使用雷諾規則作為協作工具構建環境中智能體的自然語言指導:對齊和分離源自鄰居的工具元數據,而內聚則注入上一輪的全局摘要。

我的映射更簡單,來自閱讀本文之前建立系統:

群體規則 代理當量 它可以防止什麼
分離 產生預算:限制每個父級的活躍代理 代理在同一子問題上堆積
結盟 共享評估標準:所有代理人使用相同的證據標準 代理致力於不相容的品質定義
凝聚 共識協議:智能體趨向群體發現 Agents drifting into unrelated tangents

平行並不完美。 Boids 規則是連續的(引導朝向平均航向)。代理規則是離散的(最多產生 12 個子代)。群體在空間座標中運行。代理在問題空間中運行。但結構洞察力顯示:每個智能體獨立應用的局部規則會產生一致的群體行為。且故障模式是相同的。


23 名特務在錯誤問題上達成一致的夜晚

2026年2月,我要求我的經紀人「調查改進掛鉤調度系統」。代理人評估自己的置信度為 0.58,這觸發了 deliberation system。誕生了三名研究特務。每個人都發現了子問題並催生了自己的研究人員。這些特工產生了更多。

七分鐘後:23 個活動代理程式。 4.80 美元的 API 積分。代幣消耗以每分鐘 0.70 美元的速度攀升。

遞歸保護追蹤深度(父級生成子級,子級生成孫級),但不追蹤寬度(父級生成 12 個子級,每個子級再生成 12 個)。深度限制 3 從未觸發,因為代理是水平分佈的。我手動殺了這些進程。

每個代理商都同意掛鉤調度系統需要改進。各代理商提出了合理的修改意見。沒有一位特工質疑調查本身的範圍是否正確。

結果展示了當你有凝聚力和一致性但沒有分離時會發生什麼。代理們趨向於相同的結論(凝聚力),並在相同的評估標準上保持一致(一致性)。但沒有什麼可以阻止他們集中解決同一個子問題。用雷諾茲的話來說,23 個物體佔據了空間中的同一點,這是他的分離規則明確禁止的行為。


作為分離的生成預算

修復花了 20 分鐘。產生預算,追蹤每個父項的活動子項總數,上限為 12.[^4] 寬度約束,而不僅僅是深度。

用 boids 的術語來說,產生預算就是分離規則:不要擁擠你的鄰居。用代理術語來說:不要在一個子問題上放置超過 N 個代理,因為第 N+1 個代理會增加成本,但不會增加視角。 23特務事件告訴我,分離規則是三者中最重要的。沒有它,一致性和凝聚力就會變得病態:代理人熱情地聚集在同一個錯誤答案上。

正是出於這個原因,雷諾演算法通常將分離力的權重比對齊或內聚力高 1.5-2 倍。 [^1] 在我的系統中,hooks 強制產生預算(確定性,不受代理合理化影響),同時提示和上下文形狀對齊和內聚(更柔軟,可彎曲)。最嚴格的約束得到最嚴格的執行。


為什麼更多的規則會讓代理變得更糟

切換上面的鳥群模擬。現在想像一下新增第四條規則:「避開畫布的中心」。第五種:“更喜歡上半部。”第六種:“每 100 幀反轉航向。”

每條規則都是單獨合理的。他們一起消滅羊群。物體在競爭力量之間抖動,無法同時滿足所有限制。優雅的植絨變成了噪音。

我在代理編排中觀察到了相同的模式。我的審議系統的早期版本有詳細的規則:最低研究深度、強制引用計數、需要反駁生成、強制魔鬼代言人通過。每條規則都改進了一些特定的失敗案例。他們共同創建了花費更多代幣來滿足規則而不是解決問題的代理。

我記錄的 compounding engineering philosophy 解釋了為什麼會在系統層級發生這種情況:每個新規則都會與每個現有規則交互,從而產生組合複雜性。十個規則不會產生十個約束。它們可能產生 45 種配對交互作用。系統的行為變得更難預測、更難調試,並且更有可能產生緊急故障。

雷諾茲的原始論文含蓄地理解了這一點。他將 boids 限制為三個規則,不是因​​為他無法想像更多,而是因為三個就夠了。增加第四個就需要重新平衡所有四個的權重,這個問題隨著每次添加而呈指數級增長。

代理課程:從產生您想要的行為的最低規則開始。僅當您觀察到現有規則無法解決的特定故障時才新增規則。當您新增規則時,請檢查它是否會幹擾其他規則。


創造結構的空虛

從簡單規則中浮現出來的哲學維度與我的寫作中意想不到的東西有關。

Nothing is structural。中央控制器的缺失並不是群體的限制。這就是架構。群體協調因為沒有任何一隻鳥擁有凌駕於其他鳥之上的權威。如果一隻鳥成為領導者,系統就會變得脆弱,依賴那隻鳥的判斷,很容易失敗。

這同樣適用於代理。我的審議系統之所以有效,因為沒有任何一個代理人擁有否決權。每個代理人獨立評估。共識協議匯總了他們的發現。如果一名特工製造了垃圾,其他特工就會投票壓倒它。如果我添加一個具有超控權限的“首席代理”,我會重新引入我精心設計以消除的單點故障。

老子在同一篇文章中引用了這句話:「將其中的無內容調整到手頭的目的。」[^5] boids 演算法中的空白空間(缺乏中央控制)是使緊急協調成為可能的結構元素。


其他領域的湧現模式

「簡單的規則,緊急的行為」模式並不是 boids 或智能體所獨有的。它出現在本地決策聚合到全球結構的任何地方:

Hamming codes 展示了一種相關的湧現形式。將奇偶校驗位策略性地放置在 2 的冪位置上會創建一個系統,其中錯誤的位置出現是透過對所有「1」位元的位置進行異或運算而產生的。沒有人知道錯誤出在哪裡。錯誤位置從結構中顯現出來。孤立的單一奇偶校驗位幾乎無法告訴您任何資訊。正確位置的多個奇偶校驗位可以告訴您一切。

Conway’s Game of Life 根據應用於網格的四個規則產生滑翔機、振盪器和圖靈完備計算。這些規則比 boids 更簡單(如果一個細胞有 2-3 個鄰居,那麼它就存活,否則就會死亡)。出現的複雜性是無限的。

在每種情況下,模式都是相同的:地方規則,沒有中央協調員,緊急的全球行為。在每種情況下,都會出現相同的故障模式:增加太多規則,系統就會從優雅的出現崩潰到混亂的干擾。


要點

對於設計多代理系統的工程師:

  • **三個規則產生聚集。四個規則可能不會。 ** 雷諾茲的見解是,三個精心挑選的規則足以進行緊急協調。添加第四個會產生幹擾,從而破壞前三個產生的行為。從產生您想要的行為的最低規則開始。

  • **分離是最重要的規則。 ** 如果沒有它,一致性和凝聚力就會變得病態,代理人會聚集在相同的錯誤答案上。 spawn budget(寬度約束)是我對多代理系統所做的最有影響力的單一更改。

對於建構分散式系統的架構師:

  • 架構缺乏領導者。 集中控制會造成單點故障。透過地方規則進行的分散協調更具彈性。設計您的代理系統時不要使用“首席代理”,除非您有特定原因要添加一個。

  • **更多規則創造更多互動。 ** N 個規則產生最多 N(N-1)/2 成對交互作用。每增加一次,行為就會變得更難預測。僅當您觀察到現有規則無法解決的特定故障時才新增規則。


*Interactive Explorations 系列的一部分,演算法滿足視覺直覺:從 Hamming codes that catch their own mistakes 到沒有領導者的群體。代理編排模式詳細顯示在 The Ralph SystemMulti-Agent Deliberation 中。 metacognitive programming layer 增加了個體代理自我監控,以補充上述代理間協調。 *


[^1]:雷諾茲,C.W. (1987)。 「羊群、牛群和學校:分佈式行為模型。」SIGGRAPH ‘87:第 14 屆電腦圖形和互動技術年度會議論文集,第 25-34 頁。 red3d.com/cwr/boids/

[^2]:雷諾茲於 1998 年獲得美國電影藝術與科學學院頒發的科學與工程獎,以表彰他在 boids 工作的基礎上對行為動畫的貢獻。自《蝙蝠俠歸來》(1992 年)以來,該演算法一直用於電影製作。 oscars.org/sci-tech/ceremonies/1998。另請參閱雷諾茲的簡歷:red3d.com/cwr/resume.html

[^3]:「透過多智能體協作重新檢視新興智慧的 Boids。」NeurIPS 2025 研討會:擴展環境。 openreview.net/pdf?id=46LJ81Yqm2。該論文應用 boids 規則作為遵循觀察-反映-構建循環的代理的自然語言指導。

[^4]:產生預算實施記錄在 The Ralph System 中。關鍵的架構決策:透過掛鉤(確定性)而不是提示(建議性)強制寬度限制。被指示「限制生成」的特工將合理化超過限制。計算活動子級並阻止產生 API 呼叫的鉤子則不能。

[^5]:老子,《道德經》,第 11 章。譯文:理雅各。整篇文章討論了輪子的輪轂、房間的牆壁和容器的黏土:三個例子,實用性來自虛空,而不是材料。請參閱 Nothing is Structural 進行完整探索。