TEMM1E v3.1.0 : Agent IA qui s'auto-affine grâce aux interactions utilisateur

Ce que fait Eigen-Tune de TEMM1E
Le moteur Eigen-Tune de TEMM1E capture chaque appel LLM comme données d'entraînement étiquetées qui seraient normalement jetées. Il évalue la qualité des réponses à partir des signaux de comportement utilisateur (continuer, réessayer, rejeter), distille les connaissances dans un modèle local via un affinage LoRA, et fait progresser les modèles à travers des portes statistiques — le tout avec 0 $ de coût LLM supplémentaire.
Implémentation technique
Le système utilise un pipeline en boucle fermée à 7 étapes : Collecter, Évaluer, Curater, Entraîner, Évaluer, Tester en parallèle, Surveiller. Chaque étape a des portes mathématiques :
- SPRT (Wald, 1945) pour la graduation — une mauvaise réponse coûte 19 bonnes pour récupérer
- CUSUM (Page, 1954) pour la détection de dérive — détecte des baisses de précision de 5 % en 38 échantillons
- Score Wilson à 99 % de confiance pour l'évaluation
L'évaluation est sans coût par conception : similarité d'embedding via un modèle Ollama local (0 $), signaux de comportement utilisateur pour les tests parallèles (0 $), détection à deux niveaux avec des heuristiques instantanées plus des embeddings sémantiques, et détection de rejet multilingue sur 12 langues.
Résultats de référence
Distillation réelle sur Apple M2 (16 Go de RAM) : SmolLM2-135M affiné via LoRA avec 0,242 % de paramètres entraînables. Entraînement : 100 itérations, perte réduite de 2,45 à 1,24 (réduction de 49 %). Mémoire maximale : 0,509 Go pour l'entraînement, 0,303 Go pour l'inférence. Le modèle de base calculait incorrectement 72°F = '150°C', tandis que le modèle affiné produisait correctement '21,2°C' après avoir appris à partir de 10 exemples.
Sélection de modèle adaptée au matériel
Le système détecte automatiquement le matériel et recommande des modèles :
- SmolLM2-135M pour la preuve de concept
- Qwen2.5-1.5B pour un bon équilibre
- Phi-3.5-3.8B pour une qualité élevée
- Llama-3.1-8B pour une capacité maximale
Configurez avec /eigentune model ou laissez en automatique.
Configuration et implémentation
Activez avec une ligne dans la configuration : [eigentune] enabled = true. Le système gère la collecte, l'évaluation de la qualité, la curation des jeux de données, l'affinage, l'évaluation, la graduation et la surveillance. Chaque échec dégrade vers le cloud — jamais de silence, jamais pire qu'avant.
Construit en Rust avec 18 crates, 136 tests dans Eigen-Tune, 1 638 au total dans l'espace de travail, 0 avertissement. Open source sous licence MIT.
📖 Read the full source: r/openclaw
👀 See Also

Relay : Plan de contrôle open-source pour les agents IA OpenClaw
Relay est une application de bureau Electron qui fournit un flux de travail similaire à Claude Cowork pour OpenClaw, fonctionnant sur votre infrastructure avec votre choix de modèles LLM et des fonctionnalités de gouvernance intégrées, notamment des portes d'approbation et des pistes d'audit exportables.

Homebutler : Compétence OpenClaw pour la Gestion de Homelab via Telegram
Homebutler est un binaire Go unique (~13 Mo, zéro dépendance) qui fonctionne comme une compétence OpenClaw pour gérer les homelabs depuis le chat Telegram. Il surveille les serveurs, redémarre les conteneurs Docker, réveille les machines, scanne les réseaux et alerte en cas de pics de ressources sans sessions SSH ni connexions à un tableau de bord.

adamsreview : Un plugin de révision de PR multi-étapes pour Claude Code avec agents parallèles et boucle d'auto-correction
adamsreview est un plugin pour Claude Code qui effectue des revues de PR plus approfondies en plusieurs étapes, utilisant des sous-agents parallèles, des passes de validation, un état JSON persistant et une revue d'ensemble optionnelle via Codex CLI et les commentaires de bots PR.

Kstack : Compétence Pack pour Claude Code afin de surveiller et dépanner Kubernetes
Kstack est un pack de compétences open source qui ajoute des commandes slash comme /investigate, /audit-security et /cluster-status à Claude Code (et à d'autres agents IA) pour surveiller et dépanner des clusters K8s. Il utilise kubectl, Kubetail, Trivy et Pluto en arrière-plan.