Utiliser un LLM local comme sous-agent de code Claude pour réduire l'utilisation du contexte

✍️ OpenClawRadar📅 Publié: March 2, 2026🔗 Source
Utiliser un LLM local comme sous-agent de code Claude pour réduire l'utilisation du contexte
Ad

Claude Code peut orchestrer des tâches en les déléguant à un LLM local fonctionnant sur votre machine, de manière similaire à son utilisation de sous-agents Claude. Cette approche maintient le contenu des fichiers hors du contexte de Claude—seuls le résumé et les insights du modèle local sont renvoyés.

Fonctionnement

Un petit script Python (~120 lignes, uniquement la bibliothèque standard) exécute une boucle d'agent :

  • Vous transmettez à Claude une description de tâche sans contenu de fichier
  • Le script l'envoie au point de terminaison /v1/chat/completions de LM Studio avec les définitions d'outils read_file et list_dir
  • Le modèle local appelle lui-même ces outils pour lire les fichiers dont il a besoin
  • La boucle continue jusqu'à ce qu'il produise une réponse finale
  • Claude ne voit que le résultat

Exemple de commande :

python3 agent_lm.py --dir /chemin/vers/projet "résumer solar-system.html"

Cela donne :

  • [tour 1] → read_file({'path': 'solar-system.html'})
  • [tour 2] → Ce fichier HTML crée un système solaire animé interactif...

Le contenu du fichier entre dans le contexte du modèle local (testé avec le contexte de Qwen), pas dans celui de Claude.

Ad

Cas d'usage et limites

D'après les tests avec Qwen3.5 35B 4-bit via MLX sur Apple Silicon, cette approche convient pour :

  • Résumé et explication de code
  • Détection de bugs
  • Génération de code standard / premier jet
  • Transformation et traduction de texte (testé avec l'hébreu)
  • Tâches logiques et de raisonnement (utiliser le drapeau --think pour les problèmes plus difficiles)

Elle ne convient pas pour :

  • Les tâches nécessitant le contexte complet de Claude
  • La compréhension multi-fichiers où les relations sont importantes
  • Les tâches nécessitant l'historique de conversation actuel
  • Tout ce où la précision est critique

Considérez-le comme un assistant de niveau Haiku, pas un remplacement de Claude.

Configuration requise

  • LM Studio fonctionnant localement avec le serveur API activé
  • Un script Python pour la boucle d'agent, un autre pour les requêtes simples uniquement par prompt
  • Les deux intégrés dans un fichier global ~/.claude/CLAUDE.md pour que Claude Code sache proposer la délégation quand c'est pertinent
  • Aucun serveur MCP, aucune dépendance pip, aucune infrastructure de plugin nécessaire

Astuce de configuration : Ajoutez {%- set enable_thinking = false %} en haut du modèle Jinja. Pour la plupart des tâches, vous n'avez pas besoin que le modèle local raisonne, et cela économise du temps et des tokens tout en augmentant la vitesse sans dégradation réelle de la qualité pour de telles tâches.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

200+ spécifications de conception d'applications en Markdown – Glissez dans Claude ou Cursor pour des clones UI exacts
Tools

200+ spécifications de conception d'applications en Markdown – Glissez dans Claude ou Cursor pour des clones UI exacts

Une bibliothèque organisée de plus de 200 applications populaires sous forme de spécifications de conception Markdown structurées, avec codes hexadécimaux exacts, échelle typographique, espacements, chaque état d'écran et graphe de navigation. Importez-la dans Claude, Cursor ou tout agent d'IA pour générer des clones SwiftUI, Jetpack Compose ou Expo UI sans deviner les couleurs ou les espacements.

OpenClawRadar
Mymir : Un graphe de projet open source pour les agents de codage via MCP
Tools

Mymir : Un graphe de projet open source pour les agents de codage via MCP

Mymir offre aux agents une carte de projet basée sur un graphe avec dépendances, décisions, critères d'acceptation et notes d'exécution précédentes, livrée via MCP pour éviter de réexpliquer l'état entre les sessions.

OpenClawRadar
Plugin Slack pour Claude Code : Connectez-vous à Slack pour le contexte et les mises à jour
Tools

Plugin Slack pour Claude Code : Connectez-vous à Slack pour le contexte et les mises à jour

Slack a publié un nouveau plugin pour Claude Code qui permet de se connecter à Slack pour la recherche, la messagerie et la création de documents. Le plugin permet à Claude Code d'accéder au contexte de Slack pour débloquer des problèmes techniques et publier des mises à jour.

OpenClawRadar
Best-Backup : Un outil gratuit pour les sauvegardes de serveur OpenClaw et de conteneurs Docker
Tools

Best-Backup : Un outil gratuit pour les sauvegardes de serveur OpenClaw et de conteneurs Docker

L'outil gratuit best-backup offre des capacités de sauvegarde robustes pour les serveurs OpenClaw, incluant des sauvegardes complètes du serveur, des sauvegardes de dossiers spécifiques et des sauvegardes de conteneurs Docker, avec des fonctionnalités comme la compression, le chiffrement utilisant les clés SSH existantes et l'intégration avec Google Drive.

OpenClawRadar