NemoClaw con vLLM local: Cómo ejecutar Nemotron 9B en WSL2

Configuración Local de NemoClaw con vLLM

Un desarrollador compartió su experiencia ejecutando NemoClaw de NVIDIA, una plataforma de agentes de IA en sandbox, con un modelo local Nemotron 9B v2 utilizando vLLM en WSL2. La configuración se basa en el fork de NemoClaw de jieunl24.

Detalles Técnicos Clave

Enrutamiento de Inferencia: El enrutamiento de inferencia de NemoClaw sigue una ruta limpia: inference.local → gateway → vLLM. Sin embargo, los errores iniciales de incorporación requerían un hack de red de 3 capas que desde entonces se ha solucionado mediante el PR #412.

Compatibilidad del Analizador: Los analizadores integrados de vLLM (qwen3_coder, nemotron_v3) son incompatibles con los modelos Nemotron v2. Necesitas los analizadores de complementos oficiales de NVIDIA del repositorio NeMo en su lugar.

Brecha en la Ingeniería de Agentes: OpenClaw como plataforma de agentes proporciona una infraestructura sólida pero se distribuye con una ingeniería de prompts mínima. La brecha entre "el modelo sirve texto" y "el agente realiza trabajo útil" se trata principalmente de andamiaje en lugar de limitaciones de capacidad del modelo.

Recursos

Publicación de blog que cubre la arquitectura, configuración del analizador vLLM y observaciones sobre ingeniería de agentes: https://github.com/soy-tuber/nemoclaw-local-inference-guide/blob/master/BLOG-openclaw-agent-engineering.md
Guía de configuración (V2) con enrutamiento inference.local y sin hacks de red: https://github.com/soy-tuber/nemoclaw-local-inference-guide
Problema original de NemoClaw #315: https://github.com/NVIDIA/NemoClaw/issues/315

Esta configuración demuestra el despliegue local práctico de plataformas de agentes de IA, destacando tanto los detalles de implementación técnica como los desafíos continuos en la ingeniería de agentes.

📖 Read the full source: r/LocalLLaMA

Ejecutando NemoClaw con vLLM Local: Notas de Configuración y Observaciones de Ingeniería de Agentes

Configuración Local de NemoClaw con vLLM

Detalles Técnicos Clave

Recursos

👀 Ver también

La Habilidad OpenClaw Reduce la Transferencia de Agentes al Permitir la Autoejecución

Herramienta de Navegador de Código Abierto para Probar Servidores MCP Sin Instalación

Habilidades de Marketing de Corey Haines para Agentes de IA

ClawMetry: Panel de Observabilidad de Código Abierto para Agentes OpenClaw