Configuración Local Multi-Agente con vLLM, Claude Code y gpt-oss-120b en Linux

✍️ OpenClawRadar📅 Publicado: 26 de marzo de 2026🔗 Source
Configuración Local Multi-Agente con vLLM, Claude Code y gpt-oss-120b en Linux
Ad

Un desarrollador compartió su experiencia creando una configuración de codificación multiagente paralela completamente local en Linux después de cambiar desde Windows. La configuración utiliza vLLM para inferencia paralela, Claude Code para orquestación de agentes, y un modelo de lenguaje grande para tareas de codificación.

Componentes de la Configuración

  • Contenedor Docker de vLLM: Utilizado para despliegue fácil e inferencia paralela
  • Claude Code: Maneja la vibecodificación y la orquestación de Equipos de Agentes, configurado para apuntar al endpoint localhost de vLLM en lugar de proveedores en la nube
  • gpt-oss:120b: Sirve como el agente de codificación
  • RTX Pro 6000 Blackwell MaxQ: GPU principal para la carga de trabajo
  • Ubuntu de arranque dual: Configuración del sistema operativo
Ad

Mejoras de Rendimiento y Flujo de Trabajo

El desarrollador anteriormente utilizaba Ollama y LM Studio pero encontró que procesaban solicitudes secuencialmente y experimentaban ralentizaciones después de múltiples turnos de mensajes y llamadas a herramientas. Con vLLM, lograron procesamiento paralelo que "turboalimentó" su experiencia.

En pruebas, la configuración manejó 4 agentes colaborando simultáneamente como se muestra en una demostración en video, con la GPU capaz de soportar 8 agentes en paralelo continuamente. El único problema observado fue la reducción del rendimiento, que varía dependiendo del agente.

Tareas a escala de Equipo de Agentes que anteriormente tomaban horas para completarse secuencialmente ahora pueden hacerse en aproximadamente 30 minutos, dependiendo del alcance del proyecto. El desarrollador estima que agregar una segunda GPU MaxQ podría potencialmente escalar el sistema para manejar decenas de agentes concurrentemente.

Este enfoque paralelo permite vibecodificar múltiples proyectos local y concurrentemente, aunque puede introducir cierta latencia aumentada en ciertos escenarios. El desarrollador encontró esta compensación preferible a completar proyectos un agente a la vez.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Equipos de Agentes de Código Claude Construyen Productos Micro SaaS en 4 Horas Usando Bóvedas de Obsidian
Casos de uso

Equipos de Agentes de Código Claude Construyen Productos Micro SaaS en 4 Horas Usando Bóvedas de Obsidian

Un desarrollador construyó un sistema integral donde equipos de agentes Claude Code manejan el ciclo de vida completo de SaaS, desde el descubrimiento de ideas hasta la implementación en 4 horas. El sistema utiliza una bóveda Obsidian como memoria persistente y equipos de agentes especializados para investigación, validación, desarrollo y distribución.

OpenClawRadar
El comando /insight de Claude Code analiza patrones de flujo de trabajo de desarrolladores a partir de datos de uso real.
Casos de uso

El comando /insight de Claude Code analiza patrones de flujo de trabajo de desarrolladores a partir de datos de uso real.

Un desarrollador que construía una aplicación iOS de finanzas personales utilizó el nuevo comando /insight de Claude Code para analizar 22 días de uso: 529 mensajes, 47,604 líneas de código, 632 archivos modificados y 146 commits. El informe identificó patrones efectivos como una 'tubería de auditoría y corrección por lotes' y señaló pérdidas de tiempo como bucles de depuración.

OpenClawRadar
No desarrollador construye herramientas de narrativa astrológica con la API de Claude.
Casos de uso

No desarrollador construye herramientas de narrativa astrológica con la API de Claude.

Una persona de 77 años sin experiencia en desarrollo construyó Fortune Cast y Ember Cast utilizando a Claude como colaborador principal, creando historias astrológicas personalizadas basadas en posiciones planetarias e información personal.

OpenClawRadar
Estudio de Caso: Uso de Prompts de LLM en Lugar de Andamiaje Programático para Construcciones de Software Multiagente
Casos de uso

Estudio de Caso: Uso de Prompts de LLM en Lugar de Andamiaje Programático para Construcciones de Software Multiagente

Un estudio de caso de 10 construcciones de software autónomas utilizando un orquestador Claude Opus con acceso CLI y agentes trabajadores Codex produjo 10 juegos de navegador en TypeScript que totalizan más de 50,000 líneas de código sin intervención humana de código. La lógica de orquestación fue completamente basada en prompts, reemplazando un andamiaje construido específicamente.

OpenClawRadar