ClawCut: Un Proxy en Python que Hace que los Pequeños LLM Locales Sean Usables con OpenClaw

Qué hace ClawCut
ClawCut es una aplicación Python Flask que actúa como proxy entre servidores locales de LLM (como MLX u Ollama) y el framework OpenClaw. Fue creada para resolver problemas técnicos específicos que dificultan el uso práctico de modelos locales pequeños (7B/14B) como asistentes con OpenClaw.
Problemas clave resueltos
- Envenenamiento de contexto: Los modelos pequeños pierden el rastro del uso de herramientas cuando ven sus propias llamadas antiguas en el historial del chat
- Bucles infinitos: Los modelos se atascan repitiendo patrones en lugar de ejecutar comandos
- Problemas de salida: Los modelos muestran código bash como texto plano en el chat o se bloquean con su propio historial después de múltiples comandos
- Fallos en trabajos cron: Los trabajos programados en segundo plano generan respuestas que desaparecen porque no hay ventana de chat activa abierta
- Artefactos de LLM: Bloques de markdown vacíos, etiquetas XML internas y comillas invertidas sueltas ensucian las salidas
- Rechazo de carga de medios: Los modelos a veces se niegan a subir archivos generados
Cómo funciona
Amnesia dinámica para llamadas a herramientas: Durante el chat normal, se conserva el historial. Cuando el proxy detecta que el modelo intenta usar una herramienta del sistema, corta temporalmente el historial antiguo del chat, dando al modelo "visión de túnel" para ejecutar comandos de shell limpiamente sin bucles ni alucinaciones.
Entrega automática universal para trabajos cron: El proxy monitorea el flujo del modelo e intercepta respuestas de texto limpias al final de los procesos de pensamiento. Luego fuerza la entrega mediante llamadas automáticas a herramientas de WhatsApp, Telegram o Signal, haciendo que los trabajos cron informen proactivamente a tu teléfono.
Filtrado de artefactos: Los bloques de markdown vacíos, etiquetas XML internas y comillas invertidas sueltas se filtran antes de llegar al frontend.
Manipulación de nombres de herramientas: Manipulaciones simples del flujo evitan que los modelos se nieguen a subir archivos de medios generados.
Configuración probada
- Raspberry Pi 5 (8GB) con OpenClaw 3.8
- Mac mini M4 Pro 24GB con MLX-LLM ejecutando Qwen2.5-Coder-7B-Instruct-4bit
- Máquina Windows con Ollama y modelo Qwen 2.5 Coder 14B (planeada para integración con ClawCut)
Limitaciones
ClawCut no convierte modelos de 7B en GPT-4. Las cadenas de lógica altamente complejas y de múltiples pasos siguen siendo desafiantes para modelos pequeños. El proxy aborda específicamente obstáculos técnicos que antes los hacían casi inutilizables como asistentes cotidianos.
📖 Read the full source: r/openclaw
👀 Ver también

HolyCode: Contenedor Docker para Entornos de Codificación Persistentes de Claude AI
HolyCode es un contenedor Docker que mantiene el estado del entorno de programación con IA al cambiar de máquina o reconstruirlo. Incluye más de 30 herramientas preinstaladas, automatización del navegador con Chromium + xvfb + Playwright, y conserva el contexto en ./data/opencode.

SpecLock: Motor de Restricciones de Código Abierto para Agentes de IA de Programación
SpecLock es un servidor MCP que aplica activamente restricciones a agentes de codificación con IA como Claude Code. Bloquea las violaciones con advertencias de conflicto semántico utilizando expansión de sinónimos, detección de negación y marcado de acciones destructivas.

Clawpage: Una Herramienta que Convierte Conversaciones de OpenClaw en Sitios Web Estáticos
Un desarrollador creó Clawpage, una habilidad que transforma el historial de sesiones de OpenClaw en páginas web estáticas para conservar conversaciones valiosas, incluyendo el intercambio de ideas, la investigación y el proceso de depuración. La herramienta está disponible en GitHub.

El Complemento de Pregunta Rápida Automatiza el Desarrollo en Unity con Claude Code
Un desarrollador ha lanzado quick-question, un complemento para macOS de Unity 2021.3+ que automatiza la compilación, las pruebas y la revisión de código entre modelos cuando se utiliza Claude Code. La herramienta incluye 20 comandos de barra diagonal y utiliza un patrón 'Tribunal' donde Codex y Claude revisan mutuamente sus hallazgos.