ClawCut Proxy: Optimiza OpenClaw para LLMs Pequeños en GitHub

ClawCut Proxy ya está disponible en GitHub como una herramienta experimental diseñada para optimizar la interacción de OpenClaw con LLMs locales, especialmente modelos más pequeños que tienen dificultades con las grandes instrucciones del sistema por defecto y las definiciones de herramientas complejas de OpenClaw.

Qué resuelve ClawCut

OpenClaw envía instrucciones del sistema masivas (a menudo >28.000 caracteres) y definiciones de herramientas JSON complejas a los LLMs. Mientras que los grandes modelos en la nube o los modelos locales de gama alta (14B+) manejan esto bien, los modelos pequeños (7B, 8B) que se ejecutan en hardware limitado (Mac/MLX o Raspberry Pi) sufren de "Sobrecarga Cognitiva", lo que lleva a:

Latencia de procesamiento extrema (lento Tiempo Hasta el Primer Token)
Los modelos olvidan su identidad o las herramientas disponibles
Alucinan respuestas de texto en lugar de ejecutar scripts locales
Tiempos de espera de conexión o respuestas JSON mal formadas
Enorme consumo de RAM

Cómo funciona ClawCut

ClawCut actúa como un "Hombre en el Medio" entre OpenClaw y tu servidor LLM local con estas funciones de optimización:

RECORTE DE INSTRUCCIONES: Elimina automáticamente las habilidades por defecto no utilizadas de la instrucción del sistema para mantener la ventana de contexto pequeña y enfocada
AMNESIA INTELIGENTE: Trunca inteligentemente el historial del chat después de ejecuciones exitosas de herramientas para liberar "espacio mental" para el modelo
FORZADOR DE ATENCIÓN: Inyecta un recordatorio al final de la consulta del usuario para asegurar que el modelo priorice el uso de herramientas
FORZADOR DE HERRAMIENTAS: Inyecta palabras clave para el llamado de herramientas y apunta a comandos
RESCATE DE ENTRADA: Cortocircuita solicitudes entrantes conocidas (como Cron-Jobs) para evitar la latencia del LLM y asegurar un 100% de confiabilidad para tareas automatizadas
RESCATE BASH: Detecta llamadas de script mal formateadas (por ejemplo, bloques de código desnudos) y las convierte en llamadas de herramientas OpenClaw válidas sobre la marcha
Filtra automáticamente las marcas de tiempo dinámicas de las instrucciones del sistema para permitir respuestas casi instantáneas mediante caché de hardware
Traduce entre flujos compatibles con OpenAI (MLX) y el formato Ollama/NDJSON esperado por OpenClaw
Salida de consola en tiempo real de la duración del prefijo, recuento de tokens

Rendimiento y Depuración

ClawCut proporciona tiempos de respuesta significativamente más rápidos (TTFT) ya que el modelo tiene menos texto que procesar de entrada, confiabilidad mejorada al llamar scripts y manejo robusto de errores para interrupciones de flujo o errores de formato. Con el MODO_DEBUG habilitado, puedes inspeccionar todo el "Desorden JSON" enviado por OpenClaw para entender exactamente qué está procesando el modelo.

Cuándo usar

Ideal para modelos pequeños (7B-8B) que se ejecutan en hardware como Mac (MLX), Windows o Linux, especialmente si tu modelo "chatea" demasiado en lugar de ejecutar comandos. Usa con precaución si estás usando modelos grandes altamente inteligentes (14B+) que pueden manejar instrucciones complejas de forma nativa. En este caso, el proxy puede actuar puramente como un registrador y traductor de formato sin manipular el contenido si PASS_THROUGH_MODE = True.

📖 Read the full source: r/openclaw

ClawCut Proxy Publicado en GitHub para Optimizar OpenClaw para Pequeños LLMs

Qué resuelve ClawCut

Cómo funciona ClawCut

Rendimiento y Depuración

Cuándo usar

👀 Ver también

Logseq Brain v0.6.0: El plugin de memoria persistente para Claude Code añade registro de viaje y lecturas dirigidas por sección

Sistema de Memoria Bioinspirado para LLMs Locales: Implementación de LTP y Olvido Selectivo

Servidor MCP para contexto de base de código empaquetado en profundidad

SynapsCAD: Aplicación de escritorio de código abierto para OpenSCAD con integración de Claude AI