TEMM1E v3.1.0 : Agent IA avec Eigen-Tune pour auto-affinage

Ce que fait Eigen-Tune de TEMM1E

Le moteur Eigen-Tune de TEMM1E capture chaque appel LLM comme données d'entraînement étiquetées qui seraient normalement jetées. Il évalue la qualité des réponses à partir des signaux de comportement utilisateur (continuer, réessayer, rejeter), distille les connaissances dans un modèle local via un affinage LoRA, et fait progresser les modèles à travers des portes statistiques — le tout avec 0 $ de coût LLM supplémentaire.

Implémentation technique

Le système utilise un pipeline en boucle fermée à 7 étapes : Collecter, Évaluer, Curater, Entraîner, Évaluer, Tester en parallèle, Surveiller. Chaque étape a des portes mathématiques :

SPRT (Wald, 1945) pour la graduation — une mauvaise réponse coûte 19 bonnes pour récupérer
CUSUM (Page, 1954) pour la détection de dérive — détecte des baisses de précision de 5 % en 38 échantillons
Score Wilson à 99 % de confiance pour l'évaluation

L'évaluation est sans coût par conception : similarité d'embedding via un modèle Ollama local (0 $), signaux de comportement utilisateur pour les tests parallèles (0 $), détection à deux niveaux avec des heuristiques instantanées plus des embeddings sémantiques, et détection de rejet multilingue sur 12 langues.

Résultats de référence

Distillation réelle sur Apple M2 (16 Go de RAM) : SmolLM2-135M affiné via LoRA avec 0,242 % de paramètres entraînables. Entraînement : 100 itérations, perte réduite de 2,45 à 1,24 (réduction de 49 %). Mémoire maximale : 0,509 Go pour l'entraînement, 0,303 Go pour l'inférence. Le modèle de base calculait incorrectement 72°F = '150°C', tandis que le modèle affiné produisait correctement '21,2°C' après avoir appris à partir de 10 exemples.

Sélection de modèle adaptée au matériel

Le système détecte automatiquement le matériel et recommande des modèles :

SmolLM2-135M pour la preuve de concept
Qwen2.5-1.5B pour un bon équilibre
Phi-3.5-3.8B pour une qualité élevée
Llama-3.1-8B pour une capacité maximale

Configurez avec /eigentune model ou laissez en automatique.

Configuration et implémentation

Activez avec une ligne dans la configuration : [eigentune] enabled = true. Le système gère la collecte, l'évaluation de la qualité, la curation des jeux de données, l'affinage, l'évaluation, la graduation et la surveillance. Chaque échec dégrade vers le cloud — jamais de silence, jamais pire qu'avant.

Construit en Rust avec 18 crates, 136 tests dans Eigen-Tune, 1 638 au total dans l'espace de travail, 0 avertissement. Open source sous licence MIT.

📖 Read the full source: r/openclaw