Ausführen von NemoClaw mit lokalem vLLM: Setup-Notizen und Beobachtungen zum Agent-Engineering

Lokale NemoClaw-Einrichtung mit vLLM
Ein Entwickler teilte seine Erfahrungen mit der Ausführung von NVIDIAs NemoClaw, einer sandboxed AI-Agentenplattform, mit einem lokalen Nemotron 9B v2-Modell unter Verwendung von vLLM auf WSL2. Das Setup basiert auf jieunl24s Fork von NemoClaw.
Wichtige technische Details
Inferenz-Routing: Das Inferenz-Routing von NemoClaw folgt einem klaren Pfad: inference.local → gateway → vLLM. Anfängliche Onboarding-Fehler erforderten jedoch einen 3-Schichten-Netzwerk-Hack, der inzwischen über PR #412 behoben wurde.
Parser-Kompatibilität: Die integrierten vLLM-Parser (qwen3_coder, nemotron_v3) sind mit Nemotron v2-Modellen inkompatibel. Stattdessen benötigen Sie die offiziellen Plugin-Parser von NVIDIA aus dem NeMo-Repository.
Kluft in der Agentenentwicklung: OpenClaw als Agentenplattform bietet eine solide Infrastruktur, wird jedoch mit minimaler Prompt-Engineering ausgeliefert. Die Kluft zwischen "Modell liefert Text" und "Agent leistet nützliche Arbeit" betrifft in erster Linie das Gerüst und nicht die Fähigkeitsgrenzen des Modells.
Ressourcen
- Blogbeitrag zu Architektur, vLLM-Parser-Einrichtung und Beobachtungen zur Agentenentwicklung: https://github.com/soy-tuber/nemoclaw-local-inference-guide/blob/master/BLOG-openclaw-agent-engineering.md
- Einrichtungsanleitung (V2) mit inference.local-Routing und ohne Netzwerk-Hacks: https://github.com/soy-tuber/nemoclaw-local-inference-guide
- Originales NemoClaw-Issue #315: https://github.com/NVIDIA/NemoClaw/issues/315
Dieses Setup demonstriert die praktische lokale Bereitstellung von AI-Agentenplattformen und hebt sowohl die technischen Implementierungsdetails als auch die anhaltenden Herausforderungen in der Agentenentwicklung hervor.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Drop-in OAuth-Anbieter für persönliche FastMCP-Server auf allen Claude-Plattformen
Ein Entwickler hat einen Python-OAuth-Provider in einer einzigen Datei erstellt, der es persönlichen FastMCP-Servern ermöglicht, auf Claude.ai Web, Mobile und Desktop Plattformen zu arbeiten, ohne externe Identitätsdienste wie Auth0 oder Google zu benötigen.

Ausführen von OpenClaw und Codex CLI nativ auf Android über AnyClaw APK
Ein Entwickler hat OpenClaw und Codex CLI in eine Android-APK namens AnyClaw verpackt, wodurch das Gateway und die Control-UI lokal auf ARM64-Android-Geräten ab Version 7.0 ohne Root-Zugriff laufen können. Das Projekt erforderte das Kompilieren von Abhängigkeiten aus dem Quellcode und das Patchen mehrerer Komponenten, um Android-spezifische Einschränkungen zu bewältigen.

Wrangle: Ein nativer macOS-Editor zur Verwaltung von Claude-Code-Sitzungen
Wrangle ist ein nativer macOS-Markdown-Editor, der speziell für die Verwaltung mehrerer Claude Code-Sitzungen entwickelt wurde und eingebettete Terminals sowie intelligente Benachrichtigungen bietet. Der Entwickler hat ihn erstellt, nachdem VS Code mit seinem täglichen Workflow, bei dem viele Claude Code-Sitzungen laufen, nicht mehr mithalten konnte.

Orc: Open-Source Multi-Project-Orchestrator für KI-Codierungsagenten
Orc ist ein Orchestrator auf Betriebssystemebene, der KI-Codierungsagenten über mehrere Projekte hinweg koordiniert, indem er bash, tmux und git worktrees verwendet. Er behandelt Merge-Konflikte, doppelte Arbeit und Koordinationsaufwand mit einem zweistufigen Review-System und ohne Token-Verbrauch für die Orchestrierung.