새 떼에서 에이전트로: AI 시스템의 군집 규칙

1986년에 크레이그 레이놀즈(Craig Reynolds)는 사소해 보이는 질문을 던졌습니다. 새들은 어떻게 모여들까요? 철학적인 질문은 아닙니다. 공학적인 것. 그는 각 새의 경로를 스크립트로 작성하지 않고 컴퓨터 그래픽으로 설득력 있는 무리를 렌더링하고 싶었습니다.

그의 대답은 세 가지 규칙을 사용했습니다. 분리: 이웃이 붐비는 것을 피하기 위해 조종하십시오. 정렬: 이웃의 평균 방향을 향해 조종합니다. 응집력: 이웃의 평균 위치를 향해 나아갑니다. 리더도 없고, 비행 계획도 없고, 중앙 통제관도 없습니다. 각 새에 국지적으로 적용되는 단 세 가지 규칙으로 실제 무리 짓기와 구별할 수 없는 글로벌 조정이 이루어집니다.¹

40년 후, 나는 결정에 대해 조사하고 토론하고 투표하는 10명의 전문 에이전트와 함께 multi-agent AI system를 운영합니다. 23일 밤, 그 에이전트들이 잘못된 질문에 대해 완벽한 합의를 이루었을 때 나는 Reynolds가 설명한 것과 동일한 역학, 즉 단순한 규칙에서 발생하는 조정과 동일한 메커니즘에서 발생하는 실패를 보고 있다는 것을 깨달았습니다.

TL;DR

레이놀즈의 새 떼 시뮬레이션(boids) 알고리즘은 세 가지 간단한 로컬 규칙이 중앙 집중식 제어 없이 일관된 전역 동작을 생성한다는 것을 보여줍니다. 로컬 지침(이 코드 평가, 보안 표면 확인, 이 아키텍처 검토)을 따르는 에이전트는 규칙이 잘 선택되면 긴급 조정을 생성하고 그렇지 않으면 긴급 혼란을 초래합니다. 극단적인 사례를 해결하기 위해 더 많은 규칙을 추가하면 상담원이 더 좋아지는 것이 아니라 악화됩니다. 내 23-agent runaway incident는 이것을 증명했습니다. 깊이뿐만 아니라 너비를 제한하는 스폰 예산은 레이놀즈의 분리 규칙과 동등한 에이전트입니다.

세 가지 규칙, 무한한 무리

위의 규칙을 전환하여 무슨 일이 일어나는지 확인하세요. 세 가지가 모두 활성화되면 보이드가 자연스럽게 모여듭니다. 분리를 제거하면 단일 덩어리로 붕괴됩니다. 정렬을 제거하면 무작위 동작으로 흩어집니다. 결합력을 제거하면 로컬 헤딩을 유지하면서 서로 떨어져 표류합니다. 각 규칙이 필요합니다. 어느 것 하나만으로는 충분하지 않습니다.

Reynolds는 SIGGRAPH 1987에서 이를 “Flocks, Herds, and Schools: A Distributed Behavioral Model”로 발표했습니다. ¹ 이 논문은 컴퓨터 그래픽을 변경했습니다. 보이드 이전에는 애니메이션 무리에 손으로 직접 작성한 경로가 필요했습니다. 보이드 이후에는 규칙에서 무리가 등장했습니다. 10여 년 후인 1998년에 레이놀즈는 이 작품으로 영화 예술 과학 아카데미로부터 과학 및 공학상을 받았습니다.²

더 깊은 기여는 구체적인 규칙이 아니었습니다. 글로벌 조정에는 글로벌 지식이 필요하지 않다는 증거였습니다. 각 보이드는 인접한 이웃에 대해서만 알고 있습니다. 어떤 보이드도 무리의 지도를 가지고 있지 않습니다. 어느 누구도 무리의 목적지를 알지 못합니다. 무리에는 목적지가 없습니다. 조화로운 움직임처럼 보이는 것은 글로벌 패턴을 만들어내는 지역적 결정입니다.

픽셀에서 프로세스까지

새 떼(보이드)에서 AI 에이전트로의 매핑은 은유적이지 않습니다. NeurIPS 2025 워크숍 논문인 “다중 에이전트 협업을 통해 새로운 지능을 위한 보이드 재검토”는 다중 에이전트 시스템에 새 무리(보이드) 원리를 명시적으로 적용합니다. ³ 이 문서는 레이놀즈의 규칙을 협업 도구 구축 환경에서 에이전트를 위한 자연어 지침으로 사용합니다. 정렬 및 분리는 이웃 도구 메타데이터에서 파생되는 반면 응집력은 이전 라운드의 전체 요약을 주입합니다.

내 매핑은 더 간단하며 논문을 읽기 전에 시스템을 구축하여 이루어졌습니다.

보이드 규칙	대리인과 동등함	예방하는 것
분리	생성 예산: 상위당 활성 에이전트 제한	동일한 하위 문제에 대한 상담원 누적
조정	공유 평가 기준: 모든 에이전트는 동일한 증거 표준을 사용합니다.	호환되지 않는 품질 정의를 위해 노력하는 상담원
응집력	합의 프로토콜: 에이전트가 그룹 조사 결과로 수렴됩니다.	관련 없는 접선으로 표류하는 에이전트

평행선은 완벽하지 않습니다. 보이드 규칙은 연속적입니다(평균 방향으로 방향 조정). 에이전트 규칙은 개별적입니다(최대 12명의 하위 생성). 보이드는 공간 좌표에서 작동합니다. 에이전트는 문제 공간에서 작동합니다. 그러나 구조적 통찰력은 유지됩니다. 각 에이전트가 독립적으로 적용되는 로컬 규칙은 일관된 그룹 행동을 생성합니다. 그리고 실패 모드는 동일합니다.

23명의 요원이 잘못된 질문에 동의한 밤

2026년 2월. 에이전트에게 “훅 디스패치 시스템 개선을 조사해달라”고 요청했습니다. 에이전트는 자체 신뢰도를 0.58로 평가하여 deliberation system를 트리거했습니다. 세 명의 연구 요원이 생성되었습니다. 각각은 하위 문제를 발견하고 자체 연구 에이전트를 생성했습니다. 그 요원들은 더 많이 생겨났습니다.

7분 후: 23개의 활성 에이전트 프로세스. API 크레딧 $4.80. 분당 $0.70의 토큰 소비 증가.

재귀 가드는 깊이(부모가 자식을 생성하고 자식이 손자를 생성함)를 추적했지만 너비는 추적하지 않았습니다(부모가 12개의 자식을 생성하고 각각 12개씩 더 생성함). 에이전트가 수평으로 퍼져 있기 때문에 깊이 제한 3은 트리거되지 않았습니다. 프로세스를 수동으로 종료했습니다.

모든 상담원은 후크 디스패치 시스템에 개선이 필요하다는 데 동의했습니다. 모든 상담원은 합리적인 변경을 제안했습니다. 조사 자체의 범위가 올바른지 의문을 제기하는 요원은 단 한 명도 없었습니다.

결과는 응집력과 정렬이 있지만 분리가 없을 때 어떤 일이 발생하는지 보여줍니다. 에이전트는 동일한 결론(결합)을 향해 수렴하고 동일한 평가 기준(정렬)에 정렬됩니다. 그러나 그들이 동일한 하위 문제에 몰두하는 것을 막는 것은 아무것도 없었습니다. 레이놀즈의 용어에 따르면, 23개의 보이드는 공간에서 동일한 지점을 차지했는데, 이는 그의 분리 규칙이 명시적으로 금지하는 동작입니다.

분리로서의 산란 예산

수정에는 20분이 걸렸습니다. 부모당 총 활성 하위 항목을 추적하는 스폰 예산(12로 제한).⁴ 깊이뿐만 아니라 너비 제약.

보이드 측면에서 스폰 예산은 분리 규칙입니다. 이웃을 혼잡하게 만들지 마십시오. 에이전트 측면에서 보면 N+1번째 에이전트는 관점을 추가하지 않고 비용만 추가하므로 하위 문제에 N개보다 많은 에이전트를 배치하지 마세요. 요원 23명 사건을 통해 세 가지 원칙 중 분리 원칙이 가장 중요하다는 점을 배웠습니다. 그것이 없으면 정렬과 응집력은 병적이 됩니다. 에이전트는 동일한 잘못된 대답에 열정적으로 수렴합니다.

레이놀즈의 알고리즘은 일반적으로 바로 이러한 이유로 정렬이나 응집력보다 분리력에 1.5~2배 더 높은 가중치를 부여합니다. ¹ 내 시스템에서 hooks는 생성 예산(결정론적, 에이전트 합리화에 영향을 받지 않음)을 적용하는 반면 프롬프트와 컨텍스트는 정렬 및 응집력(부드럽고 구부릴 수 있음)을 형성합니다. 가장 어려운 제약조건이 가장 엄격하게 적용됩니다.

규칙이 많을수록 상담원이 더 나빠지는 이유

위의 새 떼 시뮬레이션을 전환합니다. 이제 네 번째 규칙인 “캔버스의 중앙을 피하세요”를 추가한다고 상상해보세요. 다섯 번째: “상반부를 선호하세요.” 여섯째: “100 프레임마다 역방향.”

각 규칙은 개별적으로 합리적입니다. 그들은 함께 무리를 파괴합니다. 보이드는 경쟁 세력 사이에서 불안해하며 모든 제약 조건을 동시에 충족할 수 없습니다. 우아한 무리가 소음으로 무너집니다.

에이전트 오케스트레이션에서도 동일한 패턴을 관찰했습니다. 내 심의 시스템의 초기 버전에는 최소 연구 깊이, 필수 인용 횟수, 필수 반론 생성, 강제 악마 옹호자 통과 등 정교한 규칙이 있었습니다. 각 규칙은 특정 실패 사례를 개선했습니다. 그들은 함께 문제를 해결하는 것보다 규칙을 충족하는 데 더 많은 토큰을 소비하는 에이전트를 생산했습니다.

내가 문서화한 compounding engineering philosophy는 이것이 시스템 수준에서 발생하는 이유를 설명합니다. 각각의 새로운 규칙은 모든 기존 규칙과 상호 작용하여 조합적 복잡성을 생성합니다. 10개의 규칙은 10개의 제약 조건을 생성하지 않습니다. 그들은 잠재적으로 45개의 쌍별 상호작용을 생성합니다. 시스템의 동작은 예측하기 어렵고 디버깅하기가 더 어려워지며 긴급 오류가 발생할 가능성이 높아집니다.

Reynolds의 원본 논문은 이를 암묵적으로 이해했습니다. 그는 보이드를 세 가지 규칙으로 제한했는데, 그 이유는 더 많은 것을 상상할 수 없어서가 아니라 세 가지이면 충분했기 때문입니다. 네 번째를 추가하려면 네 가지 모두의 가중치를 재조정해야 했으며, 이 문제는 추가할 때마다 기하급수적으로 증가했습니다.

상담원 교훈: 원하는 행동을 생성하는 최소한의 규칙부터 시작하세요. 기존 규칙에서 해결되지 않는 특정 오류가 관찰되는 경우에만 규칙을 추가하세요. 그리고 규칙을 추가할 때 다른 규칙을 방해하는지 확인하세요.

구조를 만드는 공허함

단순한 규칙의 출현은 내 글에서 예상치 못한 것과 연결되는 철학적 차원을 전달합니다.

Nothing is structural. 중앙 컨트롤러가 없다는 것이 보이드의 한계는 아닙니다. 아키텍처입니다. 무리는 왜냐하면 어떤 새도 다른 새에 대한 권한을 갖지 않기 때문에 협력합니다. 만약 한 마리의 새가 리더가 된다면 시스템은 취약해지고 그 새의 판단에 의존하게 되며 실패에 취약해질 것입니다.

대리인에게도 동일하게 적용됩니다. 내 심의 시스템은 단일 대리인이 거부권을 갖지 않기 때문에 작동합니다. 각 에이전트는 독립적으로 평가합니다. 합의 프로토콜은 결과를 집계합니다. 한 에이전트가 쓰레기를 생산하면 다른 에이전트가 이를 찬성합니다. 재정의 권한이 있는 “리드 에이전트”를 추가하면 제거하기 위해 심의한 단일 실패 지점을 다시 도입합니다.

같은 게시물에서 Lao Tzu는 다음과 같이 인용했습니다. “그 안에 있는 아무 것도 현재 목적에 맞게 조정하세요.” ⁵ 보이드 알고리즘의 빈 공간(중앙 제어가 없음)은 긴급 조정을 가능하게 하는 구조적 요소입니다.

다른 도메인의 새로운 패턴

“간단한 규칙, 긴급 행동” 패턴은 보이드나 에이전트에만 국한되지 않습니다. 이는 지역 결정이 글로벌 구조로 통합되는 모든 곳에 나타납니다.

Hamming codes는 관련된 출현 형태를 보여줍니다. 2의 거듭제곱인 위치에 패리티 비트를 전략적으로 배치하면 모든 “1” 비트의 위치를 XOR하여 오류 위치가 나타나는 시스템이 만들어집니다. 오류가 어디에 있는지 아무도 모릅니다. 오류 위치는 구조에서 나타납니다. 고립된 단일 패리티 비트는 거의 아무 것도 알려주지 않습니다. 올바른 위치에 있는 여러 패리티 비트가 모든 것을 알려줍니다.

Conway’s Game of Life는 그리드에 적용된 네 가지 규칙을 통해 글라이더, 발진기 및 튜링 완전 계산을 생성합니다. 규칙은 보이드보다 간단합니다(셀은 2~3개의 이웃이 있으면 살고, 그렇지 않으면 죽습니다). 새로운 복잡성은 무한합니다.

모든 경우에 패턴은 동일합니다. 즉, 로컬 규칙, 중앙 조정자 없음, 긴급 글로벌 동작 등이 있습니다. 그리고 모든 경우에 동일한 실패 모드가 적용됩니다. 너무 많은 규칙을 추가하면 시스템이 우아한 출현에서 혼란스러운 간섭으로 붕괴됩니다.

주요 내용

다중 에이전트 시스템을 설계하는 엔지니어의 경우:

세 가지 규칙에 따라 플로킹이 발생합니다. 네 가지 규칙은 그렇지 않을 수도 있습니다. 레이놀즈는 잘 선택된 세 가지 규칙이면 긴급 조정에 충분하다는 통찰력을 얻었습니다. 네 번째를 추가하면 처음 세 가지가 생성한 동작을 파괴할 수 있는 간섭이 생성됩니다. 원하는 동작을 생성하는 최소한의 규칙부터 시작하세요.
분리가 가장 중요한 규칙입니다. 분리가 없으면 정렬과 응집력이 병리적이 되어 에이전트가 동일한 잘못된 답으로 수렴됩니다. spawn budget(너비 제약)은 다중 에이전트 시스템에 적용한 가장 영향력 있는 단일 변경 사항이었습니다.

분산 시스템을 구축하는 건축가의 경우:

리더가 없는 것이 아키텍처입니다. 중앙 집중식 제어는 단일 실패 지점을 만듭니다. 지역 규칙을 통한 분산화된 조정이 더 탄력적입니다. 추가할 특별한 이유가 없는 한 “주요 에이전트” 없이 에이전트 시스템을 설계하십시오.
더 많은 규칙은 더 많은 상호작용을 생성합니다. N개의 규칙은 최대 N(N-1)/2개의 쌍별 상호작용을 생성합니다. 추가할 때마다 동작을 예측하기가 더 어려워집니다. 기존 규칙에서 해결되지 않는 특정 오류가 관찰되는 경우에만 규칙을 추가하세요.

알고리즘이 시각적 직관을 충족시키는 Interactive Explorations 시리즈의 일부: Hamming codes that catch their own mistakes부터 리더 없이 무리를 이루는 보이드까지. 에이전트 오케스트레이션 패턴은 The Ralph System 및 Multi-Agent Deliberation에 자세히 나와 있습니다. metacognitive programming layer는 위의 에이전트 간 조정을 보완하기 위해 개별 에이전트 자체 모니터링을 추가합니다.

레이놀즈, C.W.(1987). “양떼, 무리, 학교: 분산 행동 모델.” SIGGRAPH ‘87: 컴퓨터 그래픽 및 인터랙티브 기술에 관한 제14차 연례 컨퍼런스 진행, 25-34페이지. red3d.com/cwr/boids/ ↩↩↩
레이놀즈는 보이드 작업을 기반으로 한 행동 애니메이션에 대한 공헌으로 1998년 영화 예술 과학 아카데미로부터 과학 및 엔지니어링 상을 받았습니다. 이 알고리즘은 배트맨 리턴즈(1992) 이후 영화 제작에 사용되었습니다. oscars.org/sci-tech/ceremonies/1998. 레이놀즈의 이력서: red3d.com/cwr/resume.html도 참조하세요. ↩
“다중 에이전트 협업을 통해 새로운 지능을 위한 보이드 재검토.” NeurIPS 2025 워크숍: 환경 확장. openreview.net/pdf?id=46LJ81Yqm2. 이 문서에서는 관찰-반사-구축 루프를 따르는 에이전트에 대한 자연어 지침으로 보이드 규칙을 적용합니다. ↩
스폰 예산 구현은 The Ralph System에 문서화되어 있습니다. 주요 아키텍처 결정: 프롬프트(권고) 대신 후크(결정적)를 통해 너비 제한을 적용합니다. “생성을 제한”하라는 지시를 받은 에이전트는 한도를 초과했다고 합리화합니다. 활성 하위 항목을 계산하고 스폰 API 호출을 차단하는 후크는 그럴 수 없습니다. ↩
Lao Tzu, Tao Te Ching, 11장. 번역: James Legge. 전체 구절에서는 바퀴통, 방의 벽, 그릇의 점토에 대해 논의합니다. 유용성이 재료가 아닌 공허에서 나오는 세 가지 예입니다. 전체 탐색을 보려면 Nothing is Structural를 참조하세요. ↩