TEMM1E v3.0.0 : Intelligence en Essaim 5,86x Plus Rapide

Intelligence en Essaim pour les Runtimes d'Agents IA

TEMM1E v3.0.0 introduit "Many Tems" — un système d'intelligence en essaim où plusieurs travailleurs agents IA se coordonnent via la stigmergie : communication indirecte via des signaux environnementaux. Cette approche élimine la surcharge de coordination qui affecte les frameworks multi-agents traditionnels comme AutoGen, CrewAI et LangGraph, où chaque message de coordination nécessite un appel LLM et coûte des jetons.

Comment ça marche

L'Alpha (coordinateur) décompose les tâches en un graphe de dépendances avec un seul appel LLM
Une Meute de Tems (travailleurs) apparaît comme de véritables tâches tokio parallèles
Chaque Tem réclame une tâche via une transaction SQLite atomique (pas de verrous distribués)
Les Tems émettent des signaux Scent (phéromones à décroissance temporelle) pendant leur travail — "J'ai terminé", "Je suis bloqué", "C'est difficile"
Les autres Tems lisent ces signaux pour choisir leur prochaine tâche — pure arithmétique, zéro appel LLM
Les résultats s'agrègent lorsque toutes les tâches sont terminées

Détails Techniques

L'idée clé aborde la croissance du contexte : un seul agent traitant 12 sous-tâches transporte TOUTES les sorties précédentes dans son contexte. À la 12ème sous-tâche, le contexte a augmenté de 28 fois. Chaque sous-tâche supplémentaire coûte plus cher car le LLM lit tout ce qui est venu avant — croissance quadratique : h*m(m+1)/2.

Les travailleurs de la Meute ne portent que la description de leur tâche + les résultats des tâches dépendantes. Le contexte reste plat à ~190 octets, quel que soit le nombre total de sous-tâches. Linéaire, pas quadratique.

Benchmarks

Appels API réels Gemini 3 Flash (non simulés) :

12 fonctions indépendantes : Agent unique 103 secondes, Meute 18 secondes. 5,86 fois plus rapide. 7 379 jetons contre 2 149 jetons. 3,4 fois moins cher. Qualité : les deux 12/12 tests réussis.
5 sous-tâches parallèles : Agent unique 7,9 secondes, Meute 1,7 secondes. 4,54 fois plus rapide. Mêmes jetons (ratio 1,01x — prouve zéro gaspillage).
Messages simples ("bonjour") : La Meute ne s'active correctement PAS. Zéro surcharge. Invisible.

Ce qui rend cela différent

Zéro jeton de coordination. AutoGen/CrewAI utilisent le chat LLM-à-LLM pour la coordination — chaque message coûte. Le champ de phéromones de TEMM1E est arithmétique (décroissance exponentielle, similarité de Jaccard, superposition). Les calculs coûtent moins cher qu'un seul jeton.
Invisible pour les tâches simples. Le classificateur (déjà en cours d'exécution sur chaque message) décide. S'il dit "simple" ou "standard" — agent unique, zéro surcharge. La Meute ne s'active que pour les tâches véritablement complexes à livrables multiples.

Détails d'Implémentation

L'équation de sélection des tâches fait 40 lignes d'arithmétique, pas un appel LLM :

S = Affinité^2.0 * Urgence^1.5 * (1-Difficulté)^1.0 * (1-Échec)^0.8 * Récompense^1.2

1 535 tests. 71 dans la crate swarm seule, dont deux qui prouvent le parallélisme réel (4 travailleurs terminant des tâches de 200 ms en ~200 ms, pas ~800 ms).

Construit en Rust. 17 crates. Open source. Licence MIT. Le document de recherche contient chaque commande de benchmark — vous pouvez reproduire chaque nombre vous-même avec une clé API.

Limitations et Apprentissages

L'essaim n'aide pas pour les tâches en un seul tour où le LLM gère "faites ces 7 choses" en une seule réponse. Il n'y a pas d'accumulation d'historique à éliminer. Il aide lorsque les tâches impliquent plusieurs tours de boucle d'outils où le contexte grandit — ce qui est comment le travail agentique réel se produit.

L'équipe a exécuté des benchmarks sur Gemini Flash Lite (0,075 $/M d'entrée), Gemini Pro et GPT-5.2. Coût total de l'expérience : 0,04 $ sur un budget de 30 $. Le rapport complet de l'expérience inclut chaque scénario où l'essaim a perdu, pas seulement ceux où il a gagné.

📖 Read the full source: r/openclaw