Exécuter NemoClaw avec vLLM Local : Notes de Configuration et Observations sur l'Ingénierie d'Agents

Configuration locale de NemoClaw avec vLLM
Un développeur a partagé son expérience d'exécution de NemoClaw, une plateforme d'agents IA sandbox de NVIDIA, avec un modèle local Nemotron 9B v2 en utilisant vLLM sur WSL2. La configuration est basée sur le fork de NemoClaw de jieunl24.
Détails techniques clés
Routage de l'inférence : Le routage de l'inférence de NemoClaw suit un chemin propre : inference.local → passerelle → vLLM. Cependant, des bogues initiaux d'intégration ont nécessité un contournement réseau à 3 couches qui a depuis été corrigé via la PR #412.
Compatibilité des analyseurs : Les analyseurs vLLM intégrés (qwen3_coder, nemotron_v3) sont incompatibles avec les modèles Nemotron v2. Vous avez besoin des analyseurs officiels de NVIDIA provenant du dépôt NeMo à la place.
Écart en ingénierie des agents : OpenClaw en tant que plateforme d'agents fournit une infrastructure solide mais est livré avec un minimum d'ingénierie de prompts. L'écart entre "le modèle sert du texte" et "l'agent effectue un travail utile" concerne principalement l'échafaudage plutôt que les limitations de capacité du modèle.
Ressources
- Article de blog couvrant l'architecture, la configuration des analyseurs vLLM et les observations sur l'ingénierie des agents : https://github.com/soy-tuber/nemoclaw-local-inference-guide/blob/master/BLOG-openclaw-agent-engineering.md
- Guide de configuration (V2) avec routage inference.local et sans contournements réseau : https://github.com/soy-tuber/nemoclaw-local-inference-guide
- Problème original NemoClaw #315 : https://github.com/NVIDIA/NemoClaw/issues/315
Cette configuration démontre le déploiement local pratique des plateformes d'agents IA, mettant en lumière à la fois les détails de mise en œuvre technique et les défis persistants en ingénierie des agents.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

La compétence atoship d'OpenClaw transforme l'assistant IA en gestionnaire d'expédition.
La compétence atoship pour OpenClaw permet aux utilisateurs de décrire leurs besoins d'expédition en anglais simple, puis gère la sélection du transporteur, la comparaison des tarifs, l'achat d'étiquettes et le suivi. Les commandes exemple incluent 'expédier cette boîte de 1 lb à New York, option la moins chère'.

Blindspot MCP : Un cerveau externe pour les agents d'IA de codage
Blindspot MCP est un outil qui indexe des bases de code complètes en utilisant tree-sitter et SQLite pour aider les agents d'IA de codage à comprendre les symboles, les dépendances et les relations entre les fichiers, empêchant ainsi les modifications qui cassent le code en dehors de leur contexte immédiat.

Claude Code Ajoute une Fonction de Contrôle à Distance pour la Gestion des Sessions Mobiles
Claude Code permet désormais aux développeurs de démarrer des tâches dans leur terminal et de continuer à contrôler les sessions depuis des appareils mobiles via l'application Claude ou claude.ai/code, tandis que Claude s'exécute localement sur leur machine.

Colony : Une couche de coordination locale qui réduit les jetons de transfert multi-agents de 30 000 à 400
Colony est un substrat de coordination local-first qui réduit les coûts de transfert multi-agents d'environ 30 000 jetons à environ 400 en remplaçant la relecture du contexte par des observations compactes stockées dans SQLite.