Proxy ClawCut sur GitHub : Optimiser OpenClaw pour Petits LLM

Le proxy ClawCut est désormais disponible sur GitHub en tant qu'outil expérimental conçu pour optimiser l'interaction d'OpenClaw avec les LLM locaux, en particulier les petits modèles qui ont du mal avec les prompts système par défaut volumineux et les définitions d'outils complexes d'OpenClaw.

Ce que ClawCut résout

OpenClaw envoie des prompts système massifs (souvent >28 000 caractères) et des définitions d'outils JSON complexes aux LLM. Alors que les grands modèles cloud ou les modèles locaux haut de gamme (14B+) gèrent cela sans problème, les petits modèles (7B, 8B) fonctionnant sur du matériel limité (Mac/MLX ou Raspberry Pi) souffrent d'une "Surcharge Cognitive", entraînant :

Une latence de traitement extrême (temps lent jusqu'au premier jeton)
Les modèles oublient leur identité ou les outils disponibles
Des hallucinations de réponses textuelles au lieu d'exécuter des scripts locaux
Des délais d'expiration de connexion ou des réponses JSON mal formées
Une énorme consommation de RAM

Comment fonctionne ClawCut

ClawCut agit comme un "Homme du Milieu" entre OpenClaw et votre serveur LLM local avec ces fonctionnalités d'optimisation :

ÉLAGAGE DE PROMPT : Supprime automatiquement les compétences par défaut inutilisées du prompt système pour garder la fenêtre de contexte petite et ciblée
AMNÉSIE INTELLIGENTE : Tronque intelligemment l'historique des conversations après des exécutions d'outils réussies pour libérer de "l'espace mental" au modèle
FORCEUR D'ATTENTION : Injecte un rappel à la toute fin de la requête utilisateur pour s'assurer que le modèle priorise l'utilisation des outils
FORCEUR D'OUTILS : Injecte des mots-clés pour l'appel d'outils et pointe vers les commandes
SAUVETAGE D'ENTRÉE : Court-circuite les requêtes entrantes connues (comme les Cron-Jobs) pour contourner la latence LLM et garantir une fiabilité de 100% pour les tâches automatisées
SAUVETAGE BASH : Détecte les appels de scripts mal formatés (par exemple, des blocs de code nus) et les convertit à la volée en appels d'outils OpenClaw valides
Filtre automatiquement les horodatages dynamiques des prompts système pour permettre des réponses quasi instantanées via la mise en cache matérielle
Traduit entre les flux compatibles OpenAI (MLX) et le format Ollama/NDJSON attendu par OpenClaw
Sortie console en temps réel de la durée de pré-remplissage, du nombre de jetons

Performance et débogage

ClawCut offre des temps de réponse significativement plus rapides (TTFT) car le modèle a moins de texte à traiter initialement, une fiabilité améliorée lors de l'appel de scripts, et une gestion robuste des erreurs pour les interruptions de flux ou les erreurs de formatage. Avec le DEBUG_MODE activé, vous pouvez inspecter tout "l'Encombrement JSON" envoyé par OpenClaw pour comprendre exactement ce que le modèle est en train de traiter.

Quand l'utiliser

Idéal pour les petits modèles (7B-8B) fonctionnant sur du matériel comme Mac (MLX), Windows ou Linux, surtout si votre modèle "bavarde" trop au lieu d'exécuter des commandes. À utiliser avec prudence si vous utilisez des modèles grands et très intelligents (14B+) qui peuvent gérer nativement des prompts complexes. Dans ce cas, le proxy peut agir uniquement comme un enregistreur et traducteur de format sans manipuler le contenu si PASS_THROUGH_MODE = True.

📖 Read the full source: r/openclaw