TEMM1E v3.0.0 introduit l'Intelligence en Essaim pour la Coordination des Agents IA

✍️ OpenClawRadar📅 Publié: March 18, 2026🔗 Source
TEMM1E v3.0.0 introduit l'Intelligence en Essaim pour la Coordination des Agents IA
Ad

Intelligence en Essaim pour les Runtimes d'Agents IA

TEMM1E v3.0.0 introduit "Many Tems" — un système d'intelligence en essaim où plusieurs travailleurs agents IA se coordonnent via la stigmergie : communication indirecte via des signaux environnementaux. Cette approche élimine la surcharge de coordination qui affecte les frameworks multi-agents traditionnels comme AutoGen, CrewAI et LangGraph, où chaque message de coordination nécessite un appel LLM et coûte des jetons.

Comment ça marche

  • L'Alpha (coordinateur) décompose les tâches en un graphe de dépendances avec un seul appel LLM
  • Une Meute de Tems (travailleurs) apparaît comme de véritables tâches tokio parallèles
  • Chaque Tem réclame une tâche via une transaction SQLite atomique (pas de verrous distribués)
  • Les Tems émettent des signaux Scent (phéromones à décroissance temporelle) pendant leur travail — "J'ai terminé", "Je suis bloqué", "C'est difficile"
  • Les autres Tems lisent ces signaux pour choisir leur prochaine tâche — pure arithmétique, zéro appel LLM
  • Les résultats s'agrègent lorsque toutes les tâches sont terminées

Détails Techniques

L'idée clé aborde la croissance du contexte : un seul agent traitant 12 sous-tâches transporte TOUTES les sorties précédentes dans son contexte. À la 12ème sous-tâche, le contexte a augmenté de 28 fois. Chaque sous-tâche supplémentaire coûte plus cher car le LLM lit tout ce qui est venu avant — croissance quadratique : h*m(m+1)/2.

Les travailleurs de la Meute ne portent que la description de leur tâche + les résultats des tâches dépendantes. Le contexte reste plat à ~190 octets, quel que soit le nombre total de sous-tâches. Linéaire, pas quadratique.

Benchmarks

Appels API réels Gemini 3 Flash (non simulés) :

  • 12 fonctions indépendantes : Agent unique 103 secondes, Meute 18 secondes. 5,86 fois plus rapide. 7 379 jetons contre 2 149 jetons. 3,4 fois moins cher. Qualité : les deux 12/12 tests réussis.
  • 5 sous-tâches parallèles : Agent unique 7,9 secondes, Meute 1,7 secondes. 4,54 fois plus rapide. Mêmes jetons (ratio 1,01x — prouve zéro gaspillage).
  • Messages simples ("bonjour") : La Meute ne s'active correctement PAS. Zéro surcharge. Invisible.
Ad

Ce qui rend cela différent

  • Zéro jeton de coordination. AutoGen/CrewAI utilisent le chat LLM-à-LLM pour la coordination — chaque message coûte. Le champ de phéromones de TEMM1E est arithmétique (décroissance exponentielle, similarité de Jaccard, superposition). Les calculs coûtent moins cher qu'un seul jeton.
  • Invisible pour les tâches simples. Le classificateur (déjà en cours d'exécution sur chaque message) décide. S'il dit "simple" ou "standard" — agent unique, zéro surcharge. La Meute ne s'active que pour les tâches véritablement complexes à livrables multiples.

Détails d'Implémentation

L'équation de sélection des tâches fait 40 lignes d'arithmétique, pas un appel LLM :

S = Affinité^2.0 * Urgence^1.5 * (1-Difficulté)^1.0 * (1-Échec)^0.8 * Récompense^1.2

1 535 tests. 71 dans la crate swarm seule, dont deux qui prouvent le parallélisme réel (4 travailleurs terminant des tâches de 200 ms en ~200 ms, pas ~800 ms).

Construit en Rust. 17 crates. Open source. Licence MIT. Le document de recherche contient chaque commande de benchmark — vous pouvez reproduire chaque nombre vous-même avec une clé API.

Limitations et Apprentissages

L'essaim n'aide pas pour les tâches en un seul tour où le LLM gère "faites ces 7 choses" en une seule réponse. Il n'y a pas d'accumulation d'historique à éliminer. Il aide lorsque les tâches impliquent plusieurs tours de boucle d'outils où le contexte grandit — ce qui est comment le travail agentique réel se produit.

L'équipe a exécuté des benchmarks sur Gemini Flash Lite (0,075 $/M d'entrée), Gemini Pro et GPT-5.2. Coût total de l'expérience : 0,04 $ sur un budget de 30 $. Le rapport complet de l'expérience inclut chaque scénario où l'essaim a perdu, pas seulement ceux où il a gagné.

📖 Read the full source: r/openclaw

Ad

👀 See Also

Table Ronde IA : Outil pour Comparer Plus de 200 Modèles d'IA sur des Questions Structurées
Tools

Table Ronde IA : Outil pour Comparer Plus de 200 Modèles d'IA sur des Questions Structurées

AI Roundtable est un outil gratuit qui permet aux utilisateurs de poser des questions avec des options de réponse définies, de sélectionner jusqu'à 50 modèles parmi une base de plus de 200, et d'obtenir des réponses structurées dans des conditions identiques. Il comprend également une fonction de débat où les modèles peuvent voir le raisonnement des autres et un modèle de relecture qui résume les transcriptions.

OpenClawRadar
Application de Leadership avec 90+ Leçons issues de 20+ Livres – Fonctionne dans Claude
Tools

Application de Leadership avec 90+ Leçons issues de 20+ Livres – Fonctionne dans Claude

Un développeur a créé une application de leadership qui fonctionne dans Claude, proposant plus de 90 leçons extraites de plus de 20 livres sur le leadership, les habitudes, la discipline, l'influence, la culture d'équipe et l'état d'esprit de richesse. L'application fournit des leçons quotidiennes avec des actions spécifiques, un suivi des séries, un journal et des fonctionnalités de recherche.

OpenClawRadar
🦀
Tools

MTP + Mémoire Unifiée améliore l'inférence de llama.cpp de 30% sur RTX 5090

L'activation de la spéculation MTP avec GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 fait passer Qwen3.6-27B Q8_0 de 49 à 64 tok/s sur une RTX 5090 avec 128 Go de RAM système.

OpenClawRadar
Autoencodeurs de langage naturel : Transformer les représentations internes de Claude en texte
Tools

Autoencodeurs de langage naturel : Transformer les représentations internes de Claude en texte

Transformer Circuits Thread publie Natural Language Autoencoders qui déchiffrent les activations internes de Claude en texte lisible. Dépôt GitHub et démo interactive disponibles.

OpenClawRadar