NemoClawをローカルvLLMで実行する:セットアップメモとエージェントエンジニアリングの観察

vLLMを使用したローカルNemoClawセットアップ
開発者が、WSL2上でvLLMを使用してローカルのNemotron 9B v2モデルでNVIDIAのNemoClaw(サンドボックス化されたAIエージェントプラットフォーム)を実行した経験を共有しました。このセットアップは、jieunl24のNemoClawフォークに基づいています。
主要な技術的詳細
推論ルーティング: NemoClawの推論ルーティングは、明確なパスをたどります:inference.local → gateway → vLLM。ただし、初期のオンボーディングバグにより、3層ネットワークハックが必要でしたが、これはPR #412によって修正されました。
パーサー互換性: 組み込みのvLLMパーサー(qwen3_coder、nemotron_v3)は、Nemotron v2モデルと互換性がありません。代わりに、NeMoリポジトリからNVIDIAの公式プラグインパーサーを使用する必要があります。
エージェントエンジニアリングのギャップ: エージェントプラットフォームとしてのOpenClawは堅牢なインフラストラクチャを提供しますが、最小限のプロンプトエンジニアリングしか備えていません。「モデルがテキストを提供する」と「エージェントが有用な作業を行う」の間のギャップは、主にモデルの能力制限ではなく、スキャフォールディングに関するものです。
リソース
- アーキテクチャ、vLLMパーサーセットアップ、およびエージェントエンジニアリングの観察をカバーするブログ記事:https://github.com/soy-tuber/nemoclaw-local-inference-guide/blob/master/BLOG-openclaw-agent-engineering.md
- 推論.localルーティングとネットワークハックなしのセットアップガイド(V2):https://github.com/soy-tuber/nemoclaw-local-inference-guide
- 元のNemoClaw issue #315:https://github.com/NVIDIA/NemoClaw/issues/315
このセットアップは、AIエージェントプラットフォームの実用的なローカルデプロイメントを示しており、技術的な実装の詳細とエージェントエンジニアリングにおける継続的な課題の両方を強調しています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

NPCterm: AIエージェント向けMCP経由の完全PTYターミナルエミュレータ
NPCtermは、MCP(Model Context Protocol)を介して公開される、AIエージェント向けのヘッドレス・インメモリ完全PTY端末エミュレータです。15個のMCPツールを備え、端末制御、プロセス状態検出、およびTUIアプリケーションのサポートを提供します。

Claude 用のセルフホスト型メモリレイヤー、Cloudflare上で無料稼働
Cloudflare Worker MCPサーバーにより、ClaudeはWorkers AIとVectorizeを使ったセマンティック検索でノートの記憶と想起が可能に。すべて無料枠で動作します。

オープンソースMCPサーバーがClaudeをブラジル中央銀行の経済データに接続
Sidney Bissoliは、MITライセンスのMCPサーバー「bcb-br-mcp」を作成しました。このサーバーは、ブラジル中央銀行(SGS/BCB)の18,000以上の時系列データにClaudeからアクセスできるようにします。サーバーには、金利、インフレ、為替レート、GDP、雇用、信用データをカバーする8つのツールが含まれています。

SynapsCAD: OpenSCAD用オープンソースデスクトップアプリ、Claude AI統合版
SynapsCADは、OpenSCADコードエディター、リアルタイム3Dビューポート、AIアシスタントを統合したオープンソースのデスクトップアプリケーションです。Rustで完全に構築され、Bevy 0.15とeguiを使用しており、自然言語による3D CADコーディングのためのClaude API統合をサポートしています。