Deblank: Herramienta para Eliminar el Formato de Código y Reducir Tokens en LLM

Qué hace Deblank
Deblank es una herramienta de preprocesamiento que elimina el formato del código (sangría, espacios en blanco, saltos de línea) antes de enviar el código a LLMs, con un paso de postprocesamiento para restaurar la legibilidad. La transformación es bidireccional y segura para el AST.
Resultados de rendimiento
En evaluaciones en varios modelos (DeepSeek-V3, Claude, Gemini, etc.):
- Reducción de tokens de aproximadamente un 30% para lenguajes como Java y C++
- Reducción de tokens de aproximadamente un 9% para Python
- Impacto insignificante en la precisión Pass@1 para completado de código
- Latencia promedio: ~76ms
Lenguajes y características compatibles
- Python, Java, C/C++, C#, JavaScript/TypeScript y Go
- Maneja fragmentos incompletos razonablemente bien
- Útil para flujos de trabajo de relleno en medio
Cómo empezar
El proyecto es de código abierto con estos recursos:
- GitHub: https://github.com/anpl-code/Deblank
- Artículo: https://arxiv.org/abs/2508.13666
- Docker:
docker pull zhangcen456/deblank:latest
Este tipo de optimización de tokens puede ser particularmente útil cuando se trabaja con LLMs de contexto limitado o al procesar grandes bases de código, aunque el impacto varía según el lenguaje debido a diferencias en convenciones de formato.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

cowork-session-sync v1.0.0 proporciona continuidad de sesión para Claude Cowork.
cowork-session-sync v1.0.0 es una herramienta que mantiene la continuidad de sesión para Claude Cowork archivando transcripciones en bruto, destilándolas a Markdown y permitiendo el arranque con una frase mediante 'catchup-bunny' para restaurar el contexto completo.

Phaselock: Un Sistema de Control de Agentes de IA Inspirado en Técnicas de Crianza
Phaselock es una habilidad de agente de código abierto que implementa cuatro mecanismos de control para agentes de IA: compuertas explícitas antes de la acción, retroalimentación inmediata sobre errores, opciones restringidas y aplicación mecánica de reglas. Funciona con Claude Code, Cursor, Windsurf y herramientas que admiten hooks.

Agente de IA Local Logra Latencia de STT y TTS en Menos de un Segundo con Servidores de Código Abierto
Un desarrollador logró una latencia de ~0.2s en STT utilizando Whisper large-v3-turbo con una arquitectura híbrida de GPU gestionada por hilos y ~250ms de latencia en TTS con Coqui-TTS optimizado para síntesis de baja latencia. Ambas implementaciones son completamente autohospedadas y de código abierto.

WebClaw: Servidor MCP de Código Abierto para Extracción Web con Claude
WebClaw es un servidor MCP de código abierto construido con Claude Code que proporciona herramientas de extracción web para Claude Desktop y Claude Code, resolviendo las limitaciones del web_fetch incorporado de Claude mediante huellas digitales TLS y optimización de contenido.