ClawCut Proxy Publicado en GitHub para Optimizar OpenClaw para Pequeños LLMs

ClawCut Proxy ya está disponible en GitHub como una herramienta experimental diseñada para optimizar la interacción de OpenClaw con LLMs locales, especialmente modelos más pequeños que tienen dificultades con las grandes instrucciones del sistema por defecto y las definiciones de herramientas complejas de OpenClaw.
Qué resuelve ClawCut
OpenClaw envía instrucciones del sistema masivas (a menudo >28.000 caracteres) y definiciones de herramientas JSON complejas a los LLMs. Mientras que los grandes modelos en la nube o los modelos locales de gama alta (14B+) manejan esto bien, los modelos pequeños (7B, 8B) que se ejecutan en hardware limitado (Mac/MLX o Raspberry Pi) sufren de "Sobrecarga Cognitiva", lo que lleva a:
- Latencia de procesamiento extrema (lento Tiempo Hasta el Primer Token)
- Los modelos olvidan su identidad o las herramientas disponibles
- Alucinan respuestas de texto en lugar de ejecutar scripts locales
- Tiempos de espera de conexión o respuestas JSON mal formadas
- Enorme consumo de RAM
Cómo funciona ClawCut
ClawCut actúa como un "Hombre en el Medio" entre OpenClaw y tu servidor LLM local con estas funciones de optimización:
- RECORTE DE INSTRUCCIONES: Elimina automáticamente las habilidades por defecto no utilizadas de la instrucción del sistema para mantener la ventana de contexto pequeña y enfocada
- AMNESIA INTELIGENTE: Trunca inteligentemente el historial del chat después de ejecuciones exitosas de herramientas para liberar "espacio mental" para el modelo
- FORZADOR DE ATENCIÓN: Inyecta un recordatorio al final de la consulta del usuario para asegurar que el modelo priorice el uso de herramientas
- FORZADOR DE HERRAMIENTAS: Inyecta palabras clave para el llamado de herramientas y apunta a comandos
- RESCATE DE ENTRADA: Cortocircuita solicitudes entrantes conocidas (como Cron-Jobs) para evitar la latencia del LLM y asegurar un 100% de confiabilidad para tareas automatizadas
- RESCATE BASH: Detecta llamadas de script mal formateadas (por ejemplo, bloques de código desnudos) y las convierte en llamadas de herramientas OpenClaw válidas sobre la marcha
- Filtra automáticamente las marcas de tiempo dinámicas de las instrucciones del sistema para permitir respuestas casi instantáneas mediante caché de hardware
- Traduce entre flujos compatibles con OpenAI (MLX) y el formato Ollama/NDJSON esperado por OpenClaw
- Salida de consola en tiempo real de la duración del prefijo, recuento de tokens
Rendimiento y Depuración
ClawCut proporciona tiempos de respuesta significativamente más rápidos (TTFT) ya que el modelo tiene menos texto que procesar de entrada, confiabilidad mejorada al llamar scripts y manejo robusto de errores para interrupciones de flujo o errores de formato. Con el MODO_DEBUG habilitado, puedes inspeccionar todo el "Desorden JSON" enviado por OpenClaw para entender exactamente qué está procesando el modelo.
Cuándo usar
Ideal para modelos pequeños (7B-8B) que se ejecutan en hardware como Mac (MLX), Windows o Linux, especialmente si tu modelo "chatea" demasiado en lugar de ejecutar comandos. Usa con precaución si estás usando modelos grandes altamente inteligentes (14B+) que pueden manejar instrucciones complejas de forma nativa. En este caso, el proxy puede actuar puramente como un registrador y traductor de formato sin manipular el contenido si PASS_THROUGH_MODE = True.
📖 Read the full source: r/openclaw
👀 Ver también

Logseq Brain v0.6.0: El plugin de memoria persistente para Claude Code añade registro de viaje y lecturas dirigidas por sección
Logseq Brain v0.6.0 añade un registro de viaje para todas las operaciones, lecturas dirigidas a secciones para ahorrar tokens y divulgación progresiva para archivos de habilidades.

Sistema de Memoria Bioinspirado para LLMs Locales: Implementación de LTP y Olvido Selectivo
Un desarrollador construyó un servidor MCP local que implementa mecánicas de memoria bioinspiradas, incluyendo refuerzo de Potenciación a Largo Plazo, decaimiento por olvido selectivo y ciclos de consolidación semanales. El sistema utiliza búsqueda híbrida con sqlite-vec y respaldos de texto, arquitectura no bloqueante con ejecutores asyncio, y mantiene el estado a través de un archivo persistente 'Soul'.

Servidor MCP para contexto de base de código empaquetado en profundidad
Un nuevo servidor MCP empaqueta el contexto de la base de código en 5 niveles de profundidad dentro de los límites de tokens, abordando el problema donde los agentes de IA para programación cargan muy pocos archivos o obtienen mapas planos del repositorio sin contenido real.

SynapsCAD: Aplicación de escritorio de código abierto para OpenSCAD con integración de Claude AI
SynapsCAD es una aplicación de escritorio de código abierto que combina un editor de código OpenSCAD, una ventana gráfica 3D en tiempo real y un asistente de IA. Construida completamente en Rust con Bevy 0.15 y egui, admite la integración de la API de Claude para la programación de CAD 3D mediante lenguaje natural.