De bandadas a agentes: reglas de enjambre para sistemas de IA

En 1986, Craig Reynolds hizo una pregunta que parece trivial: ¿cómo se reúnen los pájaros? No es una pregunta filosófica. Uno de ingeniería. Quería representar bandadas convincentes en gráficos por ordenador sin escribir el recorrido de cada pájaro.

Su respuesta utilizó tres reglas. Separación: dirigirse para evitar que los vecinos se aglomeren. Alineación: dirigirse hacia el rumbo medio de los vecinos. Cohesión: orientarse hacia la posición media de los vecinos. Sin líder, sin plan de vuelo, sin controlador central. Sólo tres reglas se aplicaron localmente a cada ave, lo que produjo una coordinación global indistinguible de una bandada real.¹

Cuarenta años después, dirijo un sistema de IA multiagente con diez agentes especializados que investigan, debaten y votan decisiones. La noche en que 23 de esos agentes lograron un consenso perfecto sobre la pregunta equivocada, me di cuenta de que estaba observando la misma dinámica que describió Reynolds: coordinación emergente a partir de reglas simples y falla emergente del mismo mecanismo.

TL;DR

El algoritmo de simulación de bandadas de aves (boids) de Reynolds demuestra que tres reglas locales simples producen un comportamiento global coherente sin control centralizado. Los agentes que siguen instrucciones locales (evalúan este código, verifican esa superficie de seguridad, revisan esta arquitectura) producen una coordinación emergente cuando las reglas están bien elegidas y un caos emergente cuando no lo están. Agregar más reglas para solucionar casos extremos hace que los agentes sean peores, no mejores. Mi incidente de fuga de 23 agentes demostró esto: un presupuesto de generación que limita el ancho, no solo la profundidad, es el equivalente de agente a la regla de separación de Reynolds.

Tres reglas, bandadas infinitas

Alterna las reglas anteriores para ver qué sucede. Con los tres activos, los boids acuden naturalmente. Elimine la separación y se colapsarán en una sola masa. Elimine la alineación y se dispersarán en un movimiento aleatorio. Si se elimina la cohesión, se separarán manteniendo el rumbo local. Cada regla es necesaria. Ninguno es suficiente por sí solo.

Reynolds presentó esto en SIGGRAPH 1987 como “Bandadas, rebaños y escuelas: un modelo de comportamiento distribuido”.¹ El artículo cambió los gráficos por computadora. Antes de los boids, las bandadas animadas requerían caminos escritos a mano. Después de los boids, surgieron bandadas de reglas. Más de una década después, en 1998, Reynolds recibió el Premio Científico y de Ingeniería de la Academia de Artes y Ciencias Cinematográficas por este trabajo.²

La contribución más profunda no fueron las reglas específicas. Fue la prueba de que la coordinación global no requiere conocimiento global. Cada boid sólo conoce a sus vecinos inmediatos. Ningún chico tiene un mapa del rebaño. Ningún niño conoce el destino del rebaño. El rebaño no tiene destino. Lo que parece un movimiento coordinado son decisiones locales que producen un patrón global.

De píxeles a procesos

El mapeo de boids a agentes de IA no es metafórico. Un documento del taller de NeurIPS 2025, “Revisiting Boids for Emergent Intelligence via Multi-Agent Collaboration”, aplica explícitamente los principios de los boids a sistemas multiagente.³ El documento utiliza las reglas de Reynolds como guía en lenguaje natural para los agentes en un entorno colaborativo de creación de herramientas: la alineación y la separación se derivan de los metadatos de las herramientas vecinas, mientras que la cohesión inyecta el resumen global de la ronda anterior.

Mi mapeo es más simple y proviene de construir el sistema antes de leer el artículo:

Regla de los boids	Equivalente del agente	Qué previene
Separación	Presupuesto de generación: limitar los agentes activos por padre	Acumulación de agentes en el mismo subproblema
Alineación	Criterios de evaluación compartidos: todos los agentes utilizan el mismo estándar de evidencia	Agentes que trabajan hacia definiciones de calidad incompatibles
Cohesión	Protocolo de consenso: los agentes convergen hacia los hallazgos grupales	Agentes derivando hacia tangentes no relacionadas

El paralelo no es perfecto. Las reglas de los boids son continuas (dirigirse hacia rumbo promedio). Las reglas de los agentes son discretas (generan como máximo 12 niños). Los boids operan en coordenadas espaciales. Los agentes operan en el espacio problemático. Pero la idea estructural se mantiene: las reglas locales, aplicadas independientemente por cada agente, producen un comportamiento grupal coherente. Y los modos de falla son los mismos.

Los agentes de la noche 23 acordaron la pregunta equivocada

Febrero de 2026. Le pedí a mi agente que “investigara cómo mejorar el sistema de envío de anzuelos”. El agente evaluó su propia confianza en 0,58, lo que activó el sistema de deliberación. Surgieron tres agentes de investigación. Cada uno encontró subproblemas y generó sus propios agentes de investigación. Esos agentes engendraron más.

Siete minutos después: 23 procesos de agente activo. $4.80 en créditos API. El consumo de tokens aumenta a 0,70 dólares por minuto.

La guardia de recursión rastreaba la profundidad (el padre genera un hijo, el niño genera un nieto) pero no el ancho (el padre genera 12 hijos, cada uno de los cuales genera 12 más). El límite de profundidad de 3 nunca se activó porque los agentes se dispersaron horizontalmente. Maté los procesos manualmente.

Todos los agentes estuvieron de acuerdo en que el sistema de envío de ganchos necesitaba mejoras. Cada agente propuso cambios razonables. Ningún agente cuestionó si la investigación en sí tenía el alcance adecuado.

El resultado demuestra lo que sucede cuando hay cohesión y alineación pero no separación. Los agentes convergieron hacia la misma conclusión (cohesión) y se alinearon en los mismos criterios de evaluación (alineamiento). Pero nada les impidió concentrarse en el mismo subproblema. En términos de Reynolds, 23 boids ocupaban el mismo punto en el espacio, un comportamiento que su regla de separación impide explícitamente.

El presupuesto de generación como separación

La solución tardó 20 minutos. Un presupuesto de generación que rastrea el total de niños activos por padre, con un límite de 12.⁴ Una restricción de ancho, no solo de profundidad.

En términos generales, el presupuesto de generación es la regla de separación: no abarrotes a tus vecinos. En términos de agentes: no ponga más de N agentes en un subproblema, porque el agente N+1 agrega costos sin agregar perspectiva. El incidente de los 23 agentes me enseñó que la regla de separación es la más importante de las tres. Sin él, el alineamiento y la cohesión se vuelven patológicos: los agentes convergen con entusiasmo en la misma respuesta equivocada.

El algoritmo de Reynolds generalmente pondera la fuerza de separación entre 1,5 y 2 veces más que la alineación o la cohesión exactamente por esta razón.¹ En mi sistema, los ganchos imponen el presupuesto de generación (determinista, inmune a la racionalización del agente), mientras que las indicaciones y el contexto dan forma a la alineación y la cohesión (más suaves, flexibles). La restricción más estricta recibe la aplicación más estricta.

Por qué más reglas empeoran a los agentes

Alterna la simulación de boids arriba. Ahora imagine agregar una cuarta regla: “evite el centro del lienzo”. Un quinto: “prefiero la mitad superior”. Un sexto: “invertir el rumbo cada 100 fotogramas”.

Cada regla es individualmente razonable. Juntos, destruyen el rebaño. Los boids vibran entre fuerzas en competencia, incapaces de satisfacer todas las limitaciones simultáneamente. El elegante flocado se convierte en ruido.

Observé el mismo patrón en la orquestación de agentes. Las primeras versiones de mi sistema de deliberación tenían reglas elaboradas: profundidad mínima de investigación, recuento obligatorio de citas, generación requerida de contraargumentos, pases forzados del abogado del diablo. Cada regla mejoró algún caso de falla específico. Juntos, produjeron agentes que gastaron más fichas en satisfacer reglas que en resolver problemas.

La filosofía de ingeniería compuesta que documenté explica por qué sucede esto a nivel del sistema: cada nueva regla interactúa con cada regla existente, creando complejidad combinatoria. Diez reglas no producen diez restricciones. Producen potencialmente 45 interacciones por pares. El comportamiento del sistema se vuelve más difícil de predecir, más difícil de depurar y es más probable que produzca fallas emergentes.

El artículo original de Reynolds entendió esto implícitamente. Limitó los boids a tres reglas, no porque no pudiera imaginar más, sino porque tres eran suficientes. Agregar un cuarto habría requerido reequilibrar los pesos de los cuatro, un problema que crece exponencialmente con cada adición.

La lección del agente: comience con las reglas mínimas que produzcan el comportamiento que desea. Agregue reglas solo cuando observe una falla específica que ninguna regla existente solucione. Y cuando agregue una regla, verifique si interfiere con las demás.

El vacío que crea estructura

El surgimiento de reglas simples conlleva una dimensión filosófica que conecta con algo inesperado en mis escritos.

Nada es estructural. La ausencia de un controlador central no es una limitación de los boids. Es la arquitectura. La bandada se coordina porque ningún pájaro individual tiene autoridad sobre los demás. Si un pájaro se convirtiera en líder, el sistema se volvería frágil, dependiente del juicio de ese pájaro y vulnerable a su fracaso.

Lo mismo se aplica a los agentes. Mi sistema de deliberación funciona porque ningún agente tiene poder de veto. Cada agente evalúa de forma independiente. El protocolo de consenso agrega sus hallazgos. Si un agente produce basura, los demás lo superan en votos. Si agregara un “agente principal” con autoridad de anulación, reintroduciría el punto único de falla que construí deliberación para eliminar.

Lao Tse, citado en esa misma publicación: “Adaptar la nada que contiene al propósito que tenemos entre manos”.⁵ El espacio vacío en el algoritmo boids (la ausencia de control central) es el elemento estructural que hace posible la coordinación emergente.

Patrones emergentes en otros dominios

El patrón de “reglas simples, comportamiento emergente” no es exclusivo de los boids o agentes. Aparece allí donde las decisiones locales se agregan a una estructura global:

Los códigos Hamming demuestran una forma relacionada de emergencia. La colocación estratégica de bits de paridad en posiciones que son potencias de 2 crea un sistema donde la posición del error emerge de realizar XOR en las posiciones de todos los bits “1”. Ningún bit sabe dónde está el error. La ubicación del error surge de la estructura. Un solo bit de paridad aislado no dice casi nada. Múltiples bits de paridad en las posiciones correctas lo dicen todo.

El juego de la vida de Conway produce planeadores, osciladores y cálculos completos de Turing a partir de cuatro reglas aplicadas a una cuadrícula. Las reglas son más simples que las de los boids (una celda vive si tiene 2-3 vecinos, en caso contrario muere). La complejidad emergente es ilimitada.

En todos los casos, el patrón es el mismo: reglas locales, ausencia de un coordinador central, comportamiento global emergente. Y en todos los casos, se aplica el mismo modo de falla: agregue demasiadas reglas y el sistema colapsará desde una emergencia elegante hasta una interferencia caótica.

Conclusiones clave

Para ingenieros que diseñan sistemas multiagente:

Tres reglas producen flocado. Cuatro reglas podrían no hacerlo. La idea de Reynolds fue que tres reglas bien elegidas son suficientes para una coordinación emergente. Agregar un cuarto crea una interferencia que puede destruir el comportamiento que produjeron los tres primeros. Comience con las reglas mínimas que produzcan el comportamiento que desea.
La separación es la regla más importante. Sin ella, la alineación y la cohesión se vuelven patológicas, y los agentes convergen en la misma respuesta incorrecta. El presupuesto de generación (restricción de ancho) fue el cambio individual más impactante que hice en mi sistema multiagente.

Para arquitectos que construyen sistemas distribuidos:

La ausencia de un líder es la arquitectura. El control centralizado crea un único punto de falla. La coordinación descentralizada a través de reglas locales es más resiliente. Diseñe sus sistemas de agentes sin un “agente principal” a menos que tenga una razón específica para agregar uno.
Más reglas crean más interacciones. N reglas producen hasta N(N-1)/2 interacciones por pares. El comportamiento se vuelve más difícil de predecir con cada adición. Agregue reglas solo cuando observe una falla específica que ninguna regla existente solucione.

Parte de la serie Exploraciones interactivas, donde los algoritmos se encuentran con la intuición visual: desde códigos Hamming que detectan sus propios errores hasta boids que acuden en masa sin un líder. Los patrones de orquestación de agentes aparecen en detalle en El sistema Ralph y Deliberación multiagente. La capa de programación metacognitiva agrega el autocontrol individual de los agentes para complementar la coordinación entre agentes anterior.

Reynolds, CW (1987). “Rebaños, rebaños y escuelas: un modelo de comportamiento distribuido”. SIGGRAPH ‘87: Actas de la 14ª conferencia anual sobre gráficos por computadora y técnicas interactivas, págs. 25-34. red3d.com/cwr/boids/ ↩↩↩
Reynolds recibió el Premio Científico y de Ingeniería de la Academia de Artes y Ciencias Cinematográficas en 1998 por sus contribuciones a la animación conductual, basándose en el trabajo de los boids. El algoritmo se ha utilizado en la producción cinematográfica desde Batman Returns (1992). oscars.org/sci-tech/ceremonies/1998. Véase también el currículum de Reynolds: red3d.com/cwr/resume.html. ↩
“Revisando los Boids para obtener inteligencia emergente a través de la colaboración entre múltiples agentes”. Taller NeurIPS 2025: Escalamiento del entorno. openreview.net/pdf?id=46LJ81Yqm2. El artículo aplica reglas boids como guía en lenguaje natural para agentes que siguen un ciclo de observar-reflexionar-construir. ↩
La implementación del presupuesto de generación está documentada en The Ralph System. La decisión arquitectónica clave: imponer límites de ancho a través de ganchos (deterministas) en lugar de indicaciones (consejos). Un agente al que se le haya ordenado “limitar el desove” racionalizará más allá del límite. Un gancho que cuenta los niños activos y bloquea la llamada a la API de generación no puede hacerlo. ↩
Lao Tzu, Tao Te Ching, Capítulo 11. Traducción: James Legge. El pasaje completo analiza el cubo de una rueda, las paredes de una habitación y la arcilla de una vasija: tres ejemplos en los que la utilidad proviene del vacío, no del material. Consulte Nada es estructural para una exploración completa. ↩