Compactador de Garras: motor de compresión de tokens de 14 etapas para canalizaciones de LLM

✍️ OpenClawRadar📅 Publicado: 18 de marzo de 2026🔗 Source
Compactador de Garras: motor de compresión de tokens de 14 etapas para canalizaciones de LLM
Ad

¿Qué es Claw Compactor?

Claw Compactor es un motor de compresión de tokens LLM de código abierto construido alrededor de una Tubería de Fusión de 14 etapas. Cada etapa es un compresor especializado — desde análisis de código consciente del AST hasta muestreo estadístico JSON y deduplicación basada en simhash — encadenados a través de una arquitectura de flujo de datos inmutable donde la salida de cada etapa alimenta la siguiente.

Detalles de la Arquitectura

La Tubería de Fusión incluye estas etapas:

  • QuantumLock → Cortex → Photon → RLE → SemanticDedup → Ionizer
  • LogCrunch → SearchCrunch → DiffCrunch → StructuralCollapse
  • Neurosyntax → Nexus → TokenOpt → Abbrev

Principios de diseño clave:

  • Flujo de datos inmutable — FusionContext es una clase de datos congelada. Cada etapa produce un nuevo FusionResult; nada se modifica en el lugar.
  • Verificar antes de comprimir — Cada etapa tiene should_apply() que inspecciona el tipo de contexto, lenguaje y rol antes de realizar cualquier trabajo. Las etapas que no aplican se omiten sin costo.
  • Enrutamiento consciente del contenido — Cortex detecta automáticamente el tipo de contenido (código, JSON, registros, diferencias, resultados de búsqueda) y lenguaje (Python, Go, Rust, TypeScript, etc.), luego las etapas posteriores toman decisiones de compresión conscientes del tipo.
  • Compresión reversible — Ionizer almacena los originales en un RewindStore direccionado por hash. El LLM puede llamar a una herramienta para recuperar cualquier sección comprimida por su ID de marcador.
Ad

Resultados de Referencia

Compresión del Mundo Real (FusionEngine v7 vs Regex Heredado):

  • Código fuente Python: 25.0% de compresión (3.4x mejora sobre heredado)
  • JSON (100 elementos): 81.9% de compresión (6.5x mejora)
  • Registros de compilación: 24.1% de compresión (4.4x mejora)
  • Conversación de agente: 31.0% de compresión (5.4x mejora)
  • Diferencias Git: 15.0% de compresión (2.4x mejora)
  • Resultados de búsqueda: 40.7% de compresión (7.7x mejora)
  • Promedio ponderado: 53.9% de compresión (5.9x mejora)

Tareas Reales SWE-bench:

  • django__django-11620 (4.5K): 14.5% de compresión
  • sympy__sympy-14396 (5.5K): 19.1% de compresión
  • scikit-learn-25747 (11.8K): 15.9% de compresión
  • scikit-learn-13554 (73K): 11.8% de compresión
  • scikit-learn-25308 (81K): 14.4% de compresión

vs LLMLingua-2 (Fidelidad ROUGE-L):

  • Tasa de compresión 0.3 (agresiva): Claw Compactor 0.653 vs LLMLingua-2 0.346 (+88.2%)
  • Tasa de compresión 0.5 (equilibrada): Claw Compactor 0.723 vs LLMLingua-2 0.570 (+26.8%)

Inicio Rápido

git clone https://github.com/open-compress/claw-compactor.git
cd claw-compactor
# Evaluar tu espacio de trabajo (no destructivo)
python3 scripts/mem_compress.py /ruta/al/espacio-de-trabajo benchmark
# Tubería de compresión completa
python3 scripts/mem_compress.py /ruta/al/espacio-de-trabajo full

Requisitos: Python 3.9+. Opcional: pip install tiktoken para conteos exactos de tokens.

Uso de la API

from scripts.lib.fusion.engine import FusionEngine

engine = FusionEngine() result = engine.compress( text="def hello(): \n # función de saludo \n print('hello')", content_type="code", # o dejar que Cortex detecte automáticamente language="python", # sugerencia opcional ) print(result["compressed"]) # salida comprimida print(result["stats"]) # estadísticas por etapa

📖 Leer el código fuente completo: HN LLM Tools

Ad

👀 Ver también

Hechicero libre migra el historial de ChatGPT a proyectos de Claude — Lecciones clave sobre límites de tokens y RAG
Herramientas

Hechicero libre migra el historial de ChatGPT a proyectos de Claude — Lecciones clave sobre límites de tokens y RAG

Una herramienta gratuita y sin código transfiere exportaciones de ChatGPT a Proyectos de Claude, revelando que un JSON de 26MB alcanza los límites de tokens y la solución es dividir por temas. La RAG de Claude solo lee partes de archivos grandes, por lo que las consultas específicas funcionan mejor.

OpenClawRadar
uimax-mcp: Servidor MCP gratuito para revisión y corrección automatizada de código frontend con Claude Code
Herramientas

uimax-mcp: Servidor MCP gratuito para revisión y corrección automatizada de código frontend con Claude Code

uimax-mcp es un servidor MCP gratuito que automatiza la revisión y corrección de código frontend utilizando Claude Code. Con un solo comando, captura capturas de pantalla, ejecuta auditorías de Lighthouse y accesibilidad, escanea en busca de antipatrones y genera correcciones automatizadas.

OpenClawRadar
Editor de Video Crea Herramienta de Transcripción Gratuita Treelo Usando Código Claude
Herramientas

Editor de Video Crea Herramienta de Transcripción Gratuita Treelo Usando Código Claude

Un editor de video creó Treelo, una herramienta web gratuita que transcribe archivos de audio/video en bloques editables con marcas de tiempo, incluye preajustes de subtítulos y exporta a formatos SRT, VTT, ASS y WAV. La herramienta fue construida mediante conversaciones iterativas con Claude Code.

OpenClawRadar
SourceBridge: Herramienta de código abierto para análisis de bases de código utilizando LLMs locales
Herramientas

SourceBridge: Herramienta de código abierto para análisis de bases de código utilizando LLMs locales

SourceBridge es una herramienta de código abierto que indexa repositorios Git en gráficos de símbolos y utiliza LLMs locales para generar resúmenes de bases de código, recorridos de arquitectura y materiales de aprendizaje. Es compatible con múltiples backends locales, incluidos Ollama, llama.cpp, vLLM, LM Studio y SGLang a través de APIs compatibles con OpenAI.

OpenClawRadar