NemoClaw mit lokalem vLLM einrichten: Setup-Notizen & Agent-Engineering

Lokale NemoClaw-Einrichtung mit vLLM

Ein Entwickler teilte seine Erfahrungen mit der Ausführung von NVIDIAs NemoClaw, einer sandboxed AI-Agentenplattform, mit einem lokalen Nemotron 9B v2-Modell unter Verwendung von vLLM auf WSL2. Das Setup basiert auf jieunl24s Fork von NemoClaw.

Wichtige technische Details

Inferenz-Routing: Das Inferenz-Routing von NemoClaw folgt einem klaren Pfad: inference.local → gateway → vLLM. Anfängliche Onboarding-Fehler erforderten jedoch einen 3-Schichten-Netzwerk-Hack, der inzwischen über PR #412 behoben wurde.

Parser-Kompatibilität: Die integrierten vLLM-Parser (qwen3_coder, nemotron_v3) sind mit Nemotron v2-Modellen inkompatibel. Stattdessen benötigen Sie die offiziellen Plugin-Parser von NVIDIA aus dem NeMo-Repository.

Kluft in der Agentenentwicklung: OpenClaw als Agentenplattform bietet eine solide Infrastruktur, wird jedoch mit minimaler Prompt-Engineering ausgeliefert. Die Kluft zwischen "Modell liefert Text" und "Agent leistet nützliche Arbeit" betrifft in erster Linie das Gerüst und nicht die Fähigkeitsgrenzen des Modells.

Ressourcen

Blogbeitrag zu Architektur, vLLM-Parser-Einrichtung und Beobachtungen zur Agentenentwicklung: https://github.com/soy-tuber/nemoclaw-local-inference-guide/blob/master/BLOG-openclaw-agent-engineering.md
Einrichtungsanleitung (V2) mit inference.local-Routing und ohne Netzwerk-Hacks: https://github.com/soy-tuber/nemoclaw-local-inference-guide
Originales NemoClaw-Issue #315: https://github.com/NVIDIA/NemoClaw/issues/315

Dieses Setup demonstriert die praktische lokale Bereitstellung von AI-Agentenplattformen und hebt sowohl die technischen Implementierungsdetails als auch die anhaltenden Herausforderungen in der Agentenentwicklung hervor.

📖 Read the full source: r/LocalLLaMA

Ausführen von NemoClaw mit lokalem vLLM: Setup-Notizen und Beobachtungen zum Agent-Engineering

Lokale NemoClaw-Einrichtung mit vLLM

Wichtige technische Details

Ressourcen

👀 Siehe auch

Benchmarking von 88 kleinen GGUF-Modellen auf einem Mac Mini M4 mit 16 GB

Jean-Claude: Ein satirisches LLM-Frontend, das die EU-KI-Regulierung verspottet, mit 412 Cookie-Partnern und Mehrwertsteuer-Rechnungen alle 5 Nachrichten

AgentMind: Ein Claude-Code-Plugin, das Ihre Programmierpräferenzen lernt und anwendet

Ausnutzen des verborgenen Agentursignals (Â) von LLMs für besseres Tool Calling