Configuración de RouteLLM para el Enrutamiento Rentable de Tareas de IA

Configuración de Docker Compose para una Configuración Híbrida de IA
Un usuario de Reddit publicó una configuración detallada de Docker Compose que implementa lo que ellos llaman "Superinteligencia del Hombre Pobre" - un sistema híbrido de IA que enruta tareas entre modelos locales y en la nube según su complejidad.
Componentes Principales
El sistema utiliza cuatro servicios principales:
- vscode-openwire: Utiliza la imagen
sendmeticket/vscode-openwire:1.0.0con los puertos 3000 y 3030 expuestos. Esto proporciona acceso a GitHub Copilot a través de OpenWire, aunque la fuente señala que esto puede violar los TOS y sugiere usar una clave API disponible en su lugar. - ollama: Ejecuta
ollama/ollama:latestcon el puerto 11434 expuesto. Descarga y sirve automáticamente el modeloqwen3.5:4bcomo el modelo local "débil". - openroutellm: Utiliza la imagen
sendmeticket/openroutellm:1.0.0en el puerto 6060. Este es el servicio de enrutamiento que decide qué modelo maneja cada solicitud. - openclaw: Ejecuta
ghcr.io/openclaw/openclaw:latestcon los puertos 18789 y 18790 expuestos, sirviendo como la interfaz principal.
Configuración de RouteLLM
El servicio openroutellm está configurado con parámetros específicos:
python -m routellm.openai_server --routers bert --default-router-threshold 0.75 --port 6060 --openwire-base-url http://vscode-openwire:3030/v1 --ollama-base-url http://ollama:11434/v1 --strong-model gpt-4o --weak-model qwen3.5:4bEsta configuración utiliza enrutamiento basado en BERT con un umbral de 0.75 para determinar cuándo enviar tareas al modelo "fuerte" (GPT-4o) versus el modelo local "débil" (Qwen3.5:4b).
Cómo Funciona
El sistema enruta tareas difíciles al modelo de pago GPT-4o a través de OpenWire/Copilot, mientras que las tareas más simples son manejadas por el modelo local Qwen3.5:4b ejecutándose en Ollama. Esto crea lo que el autor describe como "un modelo de IA a prueba de fallos, local primero, con baja inteligencia base pero una inteligencia máxima realmente alta".
Todos los servicios están conectados a través de una red personalizada de Docker (openclaw_net con subred 172.10.10.0/24) e incluyen verificaciones de salud para garantizar la disponibilidad del servicio.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Hospedaje Nativo de Agentes Habilitado para MCP: Implementa Apps mediante Agentes de IA en ocl-nexus
ocl-nexus presenta una configuración de servidor MCP que permite a los agentes de codificación de IA implementar aplicaciones directamente en un entorno en vivo protegido con SSO usando solo una clave API.

La Extensión Microsoft DebugMCP para VS Code Brinda Capacidades de Depuración a Agentes de IA
Microsoft DebugMCP es una extensión de VS Code que expone el depurador completo de VS Code a los agentes de IA de codificación a través del Model Context Protocol (MCP), permitiéndoles establecer puntos de interrupción, ejecutar paso a paso el código, inspeccionar variables y evaluar expresiones.

Habilidad de Limpieza OpenClaw para la Gestión Automatizada de Sistemas y el Fortalecimiento de la Seguridad
Un desarrollador creó una habilidad que utiliza Claude Code para conectarse por SSH a máquinas OpenClaw y reforzar configuraciones, incluyendo aislamiento, higiene del sistema operativo y seguridad de canales, manteniendo una carpeta de proyecto con instrucciones de auditoría en CLAUDE.md.

El plugin 'nice-figures' de Claude Code crea gráficos Matplotlib con estilo de blog de investigación
nice-figures es un plugin para Claude Code que genera gráficos matplotlib al estilo de los blogs de investigación de Anthropic, con colores suaves y pastel. Incluye 16 recetas de gráficos, cero dependencias adicionales y estilo automático.