Correction de la fuite mémoire de Claude Code pour les homelabs Linux

Détails de la fuite de mémoire
Un développeur utilisant un homelab Proxmox avec 64 cœurs et 503 Go de RAM a subi des plantages répétés en utilisant Claude Code pour gérer des machines virtuelles, GitLab, DNS et d'autres services. Malgré une mise à niveau à 500 Go de RAM, Claude Code a consommé 400 Go et fait planter tout le système.
L'analyse du dump mémoire a révélé :
- 1,15 milliard d'objets identiques de 160 octets dans le tas
- Les objets ne sont jamais libérés (free=0)
- Taux de croissance d'environ 32 000 objets par seconde pendant une utilisation active
- L'utilisation au repos est normale
Découvertes techniques
L'enquête a mis en lumière :
- Claude Code est construit sur le runtime Bun
- Utilise deux allocateurs : mimalloc + glibc malloc
- La fuite se situe du côté de glibc malloc
- Les correctifs au niveau JavaScript ne fonctionnent pas à cause de la couche d'allocateur
- Ce problème est ouvert depuis des mois avec des dizaines de rapports sur GitHub
Solution de correctif à deux niveaux
Le développeur a créé une solution uniquement pour Linux :
Niveau 1 (seuil de 10 Go) : Shim LD_PRELOAD qui intercepte les appels malloc(160) et limite la croissance. Aucune surcharge jusqu'à ce que le seuil soit atteint.
Niveau 2 (seuil de 20 Go) : Watchdog qui redémarre la session si le Niveau 1 n'est pas suffisant, agissant comme un filet de sécurité.
Le correctif est disponible sur github.com/dalsoop/claude-code-memory-leak-fix.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

La compétence Claude Code combine les approches de DeepMind Aletheia et d'Anthropic harness.
Une compétence Claude Code implémente un pipeline Planificateur → Générateur → Évaluateur → Réviseur qui synthétise l'agent de recherche mathématique Aletheia de DeepMind avec l'architecture de codage multi-agent d'Anthropic, ajoutant une pré-analyse à l'aveugle où l'évaluateur raisonne sur les approches correctes avant de voir le code candidat.

Test pratique du modèle de Tencent : performant pour les workflows agents, faible pour le codage complexe
Le modèle de Tencent obtient un 8/10 pour les tâches agentiques avec un faible taux d'hallucination, mais échoue sur le code complexe comme les schémas de l'API Notion. À éviter pour la logique backend.

Qwen 3.5 35B Fonctionnant sur 8 Go de VRAM avec la configuration llama.cpp
Un développeur partage sa configuration llama.cpp pour exécuter Qwen 3.5 35B (Q4_K_M GGUF) sur une RTX 4060m avec 8 Go de VRAM, obtenant 700 t/s de traitement de prompt et 42 t/s de génération, et discute de l'utilisation de Cline dans VSCode avec les modes kat-coder-pro et qwen3.5.

singularité-claude : Un moteur de compétences auto-évolutif pour le code Claude
singularity-claude est un plugin open-source pour Claude Code qui ajoute une boucle d'évolution récursive pour prévenir la détérioration des compétences. Il évalue les exécutions de compétences, répare automatiquement les compétences à faible score, cristallise les versions performantes et détecte les lacunes de capacités.