NemoClawローカルvLLM実行：Nemotron 9B v2セットアップとエージェントエンジニアリングの観察

vLLMを使用したローカルNemoClawセットアップ

開発者が、WSL2上でvLLMを使用してローカルのNemotron 9B v2モデルでNVIDIAのNemoClaw（サンドボックス化されたAIエージェントプラットフォーム）を実行した経験を共有しました。このセットアップは、jieunl24のNemoClawフォークに基づいています。

主要な技術的詳細

推論ルーティング: NemoClawの推論ルーティングは、明確なパスをたどります：inference.local → gateway → vLLM。ただし、初期のオンボーディングバグにより、3層ネットワークハックが必要でしたが、これはPR #412によって修正されました。

パーサー互換性: 組み込みのvLLMパーサー（qwen3_coder、nemotron_v3）は、Nemotron v2モデルと互換性がありません。代わりに、NeMoリポジトリからNVIDIAの公式プラグインパーサーを使用する必要があります。

エージェントエンジニアリングのギャップ: エージェントプラットフォームとしてのOpenClawは堅牢なインフラストラクチャを提供しますが、最小限のプロンプトエンジニアリングしか備えていません。「モデルがテキストを提供する」と「エージェントが有用な作業を行う」の間のギャップは、主にモデルの能力制限ではなく、スキャフォールディングに関するものです。