Des volées d’oiseaux aux agents : règles d’essaim pour les systèmes d’IA

En 1986, Craig Reynolds posait une question qui semble anodine : comment les oiseaux se rassemblent-ils ? Ce n’est pas une question philosophique. Une ingénierie. Il souhaitait restituer des troupeaux convaincants en infographie sans scripter le chemin de chaque oiseau.

Sa réponse utilisait trois règles. Séparation : dirigez-vous pour éviter de surcharger les voisins. Alignement : dirigez-vous vers le cap moyen des voisins. Cohésion : se diriger vers la position moyenne des voisins. Pas de leader, pas de plan de vol, pas de contrôleur central. Seulement trois règles appliquées localement à chaque oiseau, produisant une coordination globale impossible à distinguer d’un véritable flocage.[^1]

Quarante ans plus tard, je dirige un système d’IA multi-agents avec dix agents spécialisés qui recherchent, débattent et votent sur les décisions. La nuit où 23 de ces agents sont parvenus à un consensus parfait sur la mauvaise question, j’ai réalisé que j’observais la même dynamique décrite par Reynolds : une coordination émergente à partir de règles simples et un échec émergent à partir du même mécanisme.

TL;DR

L’algorithme de simulation de vol d’oiseaux (boids) de Reynolds démontre que trois règles locales simples produisent un comportement global cohérent sans contrôle centralisé. Les agents suivant les instructions locales (évaluer ce code, vérifier cette surface de sécurité, revoir cette architecture) produisent une coordination émergente lorsque les règles sont bien choisies et un chaos émergent lorsqu’elles ne le sont pas. Ajouter plus de règles pour résoudre les cas extrêmes rend les agents pires, pas meilleurs. Mon incident de fugue de 23 agents l’a prouvé : un budget d’apparition limitant la largeur, et pas seulement la profondeur, est l’équivalent pour les agents de la règle de séparation de Reynolds.

Trois règles, des troupeaux infinis

Basculez les règles ci-dessus pour voir ce qui se passe. Avec les trois actifs, les boids se rassemblent naturellement. Supprimez la séparation et ils s’effondrent en une seule masse. Supprimez l’alignement et ils se dispersent dans un mouvement aléatoire. Supprimez la cohésion et ils se séparent tout en conservant le cap local. Chaque règle est nécessaire. Aucun n’est suffisant à lui seul.

Reynolds a présenté cela au SIGGRAPH 1987 sous le titre « Troupeaux, troupeaux et écoles : un modèle comportemental distribué ».[^1] L’article a modifié l’infographie. Avant les boids, les troupeaux animés nécessitaient des chemins écrits à la main. Après les boids, les troupeaux ont émergé des règles. Plus d’une décennie plus tard, en 1998, Reynolds a reçu le prix scientifique et d’ingénierie de l’Académie des arts et des sciences du cinéma pour ce travail.[^2]

La contribution la plus profonde n’était pas les règles spécifiques. C’était la preuve que la coordination mondiale n’exige pas une connaissance mondiale. Chaque boid ne connaît que ses voisins immédiats. Aucun boid ne possède de carte du troupeau. Aucun boid ne connaît la destination du troupeau. Le troupeau n’a aucune destination. Ce qui ressemble à un mouvement coordonné, ce sont des décisions locales produisant un modèle mondial.

Des pixels aux processus

La cartographie des boids aux agents IA n’est pas métaphorique. Un document de l’atelier NeurIPS 2025, “Revisiting Boids for Emergent Intelligence via Multi-Agent Collaboration”, applique explicitement les principes des boids aux systèmes multi-agents.[^3] Le document utilise les règles de Reynolds comme guide en langage naturel pour les agents dans un environnement de création d’outils collaboratifs : l’alignement et la séparation dérivent des métadonnées des outils des voisins, tandis que la cohésion injecte le résumé global du cycle précédent.

Mon mappage est plus simple et vient de la construction du système avant de lire l’article :

Règle des Boïdes	Agent équivalent	Ce que cela empêche
Séparation	Budget de spawn : limiter les agents actifs par parent	Carambolage d’agents sur le même sous-problème
Alignement	Critères d’évaluation partagés : tous les agents utilisent le même standard de preuve	Agents travaillant vers des définitions de qualité incompatibles
Cohésion	Protocole de consensus : les agents convergent vers les résultats du groupe	Agents dérivant dans des tangentes sans rapport

Le parallèle n’est pas parfait. Les règles des Boids sont continues (dirigez vers le cap moyen). Les règles de l’agent sont discrètes (générer au plus 12 enfants). Les boïdes fonctionnent en coordonnées spatiales. Les agents opèrent dans un espace problématique. Mais l’idée structurelle tient : les règles locales, appliquées indépendamment par chaque agent, produisent un comportement de groupe cohérent. Et les modes de défaillance sont les mêmes.

Les agents de The Night 23 se sont mis d’accord sur la mauvaise question

Février 2026. J’ai demandé à mon agent « d’étudier l’amélioration du système de répartition des crochets ». L’agent a évalué sa propre confiance à 0,58, ce qui a déclenché le système de délibération. Trois agents de recherche sont apparus. Chacun a trouvé des sous-problèmes et a engendré ses propres agents de recherche. Ces agents en ont engendré davantage.

Sept minutes plus tard : 23 processus d’agents actifs. 4,80 $ en crédits API. La consommation de jetons grimpe à 0,70 $ par minute.

Le garde de récursion a suivi la profondeur (le parent engendre un enfant, l’enfant engendre un petit-enfant) mais pas la largeur (le parent engendre 12 enfants qui en engendrent chacun 12 de plus). La limite de profondeur de 3 n’a jamais été déclenchée car les agents se sont propagés horizontalement. J’ai tué les processus manuellement.

Tous les agents ont convenu que le système de répartition des crochets devait être amélioré. Chaque agent a proposé des changements raisonnables. Aucun agent ne s’est demandé si l’enquête elle-même avait la bonne portée.

Le résultat démontre ce qui se passe lorsque vous avez cohésion et alignement mais pas de séparation. Les agents ont convergé vers la même conclusion (cohésion) et se sont alignés sur les mêmes critères d’évaluation (alignement). Mais rien ne les empêchait de s’attarder sur le même sous-problème. Selon les termes de Reynolds, 23 boides occupaient le même point dans l’espace, un comportement que sa règle de séparation empêche explicitement.

Le budget de réapparition comme séparation

Le correctif a pris 20 minutes. Un budget de génération qui suit le nombre total d’enfants actifs par parent, plafonné à 12.[^4] Une contrainte de largeur, pas seulement de profondeur.

En termes de boids, le budget de réapparition est la règle de séparation : ne surchargez pas vos voisins. En termes d’agent : ne mettez pas plus de N agents sur un sous-problème, car le N+1ème agent ajoute du coût sans ajouter de perspective. L’incident des 23 agents m’a appris que la règle de séparation est la plus importante des trois. Sans cela, l’alignement et la cohésion deviennent pathologiques : les agents convergent avec enthousiasme vers la même mauvaise réponse.

L’algorithme de Reynolds pondère généralement la force de séparation 1,5 à 2 fois plus élevée que l’alignement ou la cohésion pour exactement cette raison.[^1] Dans mon système, hooks appliquent le budget d’apparition (déterministe, immunisé contre la rationalisation des agents), tandis que les invites et le contexte façonnent l’alignement et la cohésion (plus doux, flexibles). La contrainte la plus stricte entraîne la mise en œuvre la plus stricte.

Pourquoi plus de règles rendent les agents pires

Basculez la simulation de bods ci-dessus. Imaginez maintenant ajouter une quatrième règle : “éviter le centre de la toile”. Un cinquième : « préférez la moitié supérieure ». Un sixième : « marche arrière toutes les 100 images ».

Chaque règle est individuellement raisonnable. Ensemble, ils détruisent le troupeau. Les boids tremblent entre des forces concurrentes, incapables de satisfaire toutes les contraintes simultanément. L’élégant flocage s’effondre dans le bruit.

J’ai observé le même schéma dans l’orchestration des agents. Les premières versions de mon système de délibération comportaient des règles élaborées : profondeur de recherche minimale, nombre de citations obligatoire, génération de contre-arguments requise, passes forcées de l’avocat du diable. Chaque règle a amélioré un cas d’échec spécifique. Ensemble, ils ont produit des agents qui dépensaient plus de jetons pour satisfaire aux règles que pour résoudre des problèmes.

La philosophie de l’ingénierie composée que j’ai documentée explique pourquoi cela se produit au niveau du système : chaque nouvelle règle interagit avec chaque règle existante, créant une complexité combinatoire. Dix règles ne produisent pas dix contraintes. Ils produisent potentiellement 45 interactions par paires. Le comportement du système devient plus difficile à prévoir, plus difficile à déboguer et plus susceptible de produire une panne émergente.

L’article original de Reynolds l’avait implicitement compris. Il limitait le corps à trois règles, non pas parce qu’il ne pouvait pas en imaginer davantage, mais parce que trois suffisaient. En ajouter un quatrième aurait nécessité de rééquilibrer les poids des quatre, un problème qui augmente de façon exponentielle à chaque ajout.

La leçon de l’agent : commencez par les règles minimales qui produisent le comportement souhaité. Ajoutez des règles uniquement lorsque vous observez un échec spécifique auquel aucune règle existante ne répond. Et lorsque vous ajoutez une règle, vérifiez si elle interfère avec les autres.

Le vide qui crée une structure

L’émergence de règles simples comporte une dimension philosophique qui se connecte à quelque chose d’inattendu dans mon écriture.

Rien n’est structurel. L’absence de contrôleur central n’est pas une limitation des boids. C’est l’architecture. Le troupeau se coordonne parce qu’aucun oiseau individuel n’a autorité sur les autres. Si un oiseau devenait le leader, le système deviendrait fragile, dépendant du jugement de cet oiseau et vulnérable à son échec.

Il en va de même pour les agents. Mon système de délibération fonctionne parce qu’aucun agent n’a de droit de veto. Chaque agent évalue indépendamment. Le protocole de consensus regroupe leurs conclusions. Si un agent produit des déchets, les autres sont mis en minorité. Si j’ajoutais un « agent principal » doté d’une autorité prioritaire, je réintroduirais le point de défaillance unique que j’ai construit par délibération pour éliminer.

Lao Tseu, cité dans ce même article : « Adaptez le rien qui s’y trouve au but recherché. »[^5] L’espace vide dans l’algorithme boids (l’absence de contrôle central) est l’élément structurel qui rend possible la coordination émergente.

Modèles émergents dans d’autres domaines

Le modèle « règles simples, comportement émergent » n’est pas propre aux boids ou aux agents. Il apparaît partout où les décisions locales s’agrègent dans une structure globale :

Codes Hamming démontrent une forme d’émergence connexe. Le placement stratégique des bits de parité à des positions qui sont des puissances de 2 crée un système dans lequel la position de l’erreur émerge du XORing des positions de tous les bits « 1 ». Personne ne sait où se trouve l’erreur. La localisation de l’erreur émerge de la structure. Un seul bit de parité isolé ne vous dit presque rien. Plusieurs bits de parité aux bonnes positions vous disent tout.

Conway’s Game of Life produit des planeurs, des oscillateurs et des calculs complets de Turing à partir de quatre règles appliquées à une grille. Les règles sont plus simples que celles des boids (une cellule vit si elle a 2-3 voisines, meurt sinon). La complexité émergente est illimitée.

Dans tous les cas, le schéma est le même : règles locales, pas de coordinateur central, comportement global émergent. Et dans tous les cas, le même mode d’échec s’applique : ajoutez trop de règles et le système s’effondre, passant d’une émergence élégante à une interférence chaotique.

Points clés à retenir

Pour les ingénieurs qui conçoivent des systèmes multi-agents :

Trois règles produisent du flocage. Quatre règles pourraient ne pas l’être. L’idée de Reynolds était que trois règles bien choisies suffisent pour une coordination émergente. L’ajout d’un quatrième crée des interférences qui peuvent détruire le comportement produit par les trois premiers. Commencez par les règles minimales qui produisent le comportement souhaité.
La séparation est la règle la plus importante. Sans elle, l’alignement et la cohésion deviennent pathologiques, les agents convergeant vers la même mauvaise réponse. Le budget d’apparition (contrainte de largeur) a été le changement le plus impactant que j’ai apporté à mon système multi-agent.

Pour les architectes construisant des systèmes distribués :

L’absence de leader est l’architecture. Le contrôle centralisé crée un point de défaillance unique. La coordination décentralisée via des règles locales est plus résiliente. Concevez vos systèmes d’agents sans « agent principal », sauf si vous avez une raison spécifique d’en ajouter un.
Plus de règles créent plus d’interactions. N règles produisent jusqu’à N(N-1)/2 interactions par paires. Le comportement devient plus difficile à prévoir à chaque ajout. Ajoutez des règles uniquement lorsque vous observez un échec spécifique auquel aucune règle existante ne répond.

Fait partie de la série Interactive Explorations, où les algorithmes rencontrent l’intuition visuelle : des codes de Hamming qui détectent leurs propres erreurs aux boids qui affluent sans leader. Les modèles d’orchestration des agents apparaissent en détail dans The Ralph System et Multi-Agent Deliberation. La couche de programmation métacognitive ajoute une auto-surveillance individuelle des agents pour compléter la coordination inter-agents ci-dessus.

[^1] : Reynolds, C.W. (1987). « Troupeaux, troupeaux et écoles : un modèle comportemental distribué ». SIGGRAPH ‘87 : Actes de la 14e conférence annuelle sur l’infographie et les techniques interactives, pp. 25-34. red3d.com/cwr/boids/

[^2] : Reynolds a reçu le prix scientifique et d’ingénierie de l’Académie des arts et des sciences du cinéma en 1998 pour ses contributions à l’animation comportementale, en s’appuyant sur le travail des boids. L’algorithme est utilisé dans la production cinématographique depuis Batman Returns (1992). oscars.org/sci-tech/ceremonies/1998. Voir aussi le CV de Reynolds : red3d.com/cwr/resume.html.

[^3] : “Revisiter Boids pour une intelligence émergente via une collaboration multi-agents.” Atelier NeurIPS 2025 : Environnement de mise à l’échelle. openreview.net/pdf?id=46LJ81Yqm2. L’article applique les règles boids comme guide en langage naturel pour les agents suivant une boucle observer-réfléchir-construire.

[^4] : La mise en œuvre du budget d’apparition est documentée dans Le système Ralph. La décision architecturale clé : appliquer les limites de largeur via des crochets (déterministes) plutôt que des invites (consultatives). Un agent chargé de « limiter le frai » rationalisera au-delà de la limite. Un hook qui compte les enfants actifs et bloque l’appel de l’API spawn ne le peut pas.

[^5] : Lao Tseu, Tao Te Ching, Chapitre 11. Traduction : James Legge. Le passage complet traite du moyeu d’une roue, des murs d’une pièce et de l’argile d’un récipient : trois exemples où l’utilité vient du vide et non du matériau. Voir Rien n’est structurel pour l’exploration complète.