Deblank : Outil pour Supprimer le Formatage du Code afin de Réduire les Tokens des LLM

Ce que fait Deblank
Deblank est un outil de prétraitement qui supprime la mise en forme du code (indentation, espaces, sauts de ligne) avant d'envoyer le code aux LLM, avec une étape de post-traitement pour restaurer la lisibilité. La transformation est bidirectionnelle et sûre pour l'AST.
Résultats de performance
Dans les évaluations sur plusieurs modèles (DeepSeek-V3, Claude, Gemini, etc.) :
- Réduction d'environ 30 % des tokens pour des langages comme Java et C++
- Réduction d'environ 9 % des tokens pour Python
- Impact négligeable sur la précision Pass@1 pour la complétion de code
- Latence moyenne : environ 76 ms
Langages et fonctionnalités pris en charge
- Python, Java, C/C++, C#, JavaScript/TypeScript et Go
- Gère raisonnablement bien les extraits incomplets
- Utile pour les workflows de remplissage au milieu
Pour commencer
Le projet est open-source avec ces ressources :
- GitHub : https://github.com/anpl-code/Deblank
- Article : https://arxiv.org/abs/2508.13666
- Docker :
docker pull zhangcen456/deblank:latest
Ce type d'optimisation de tokens peut être particulièrement utile lorsque l'on travaille avec des LLM à contexte limité ou lors du traitement de grandes bases de code, bien que l'impact varie selon le langage en raison des différences de conventions de mise en forme.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Système de surveillance comportementale local avec pipeline MCP et code Claude
Un développeur a créé un système de surveillance comportementale local appelé BRAIN qui suit les changements d'applications, les opérations sur fichiers et les sessions de développement, en acheminant les données via un serveur MCP personnalisé vers Claude Code. Le système fonctionne à 100 % localement sans aucune dépendance au cloud.

Le plugin Claude-ETA ajoute le chronométrage des tâches et la détection de boucles de réparation à Claude Code.
Claude-ETA est un plugin Claude Code qui chronomètre les tâches, apprend votre vitesse réelle et renvoie des données réelles à Claude avant qu'il ne réponde. Il détecte également les boucles de réparation en identifiant le contenu des erreurs et intervient après trois échecs identiques.

RescueBot : Sauvegarde et restauration basées sur Telegram pour les bots OpenClaw
RescueBot est une fonctionnalité légère qui capture automatiquement les configurations des bots OpenClaw et permet une restauration en un clic via des commandes Telegram, éliminant le besoin d'accès SSH lors des pannes.

Semble : Recherche de code pour agents IA utilisant 98 % de tokens en moins que grep+read
Semble est une bibliothèque de recherche de code open source pour agents IA qui combine des embeddings statiques Model2Vec avec BM25, fonctionnant entièrement sur CPU. Elle indexe un dépôt en ~250 ms et répond aux requêtes en ~1,5 ms, atteignant 0,854 NDCG@10 — 99 % de la qualité d'un transformer de 137M paramètres — tout en utilisant 98 % de tokens en moins que grep+read.