NemoClawサンドボックス隔離を回避してローカルNemotron 9Bエージェントを実行する

完全ローカル推論のためのNemoClaw回避策
開発者がNVIDIAのNemoClawサンドボックス分離を回避し、完全ローカルのAIエージェントを実行する方法を文書化しました。GTCで発表されたNemoClawは、OpenShell(k3s + Landlock + seccomp)上に構築されたAIエージェント向けの企業向けサンドボックスで、デフォルトではクラウドAPI接続を想定しており、ローカルネットワーキングを厳しく制限しています。
技術的実装の詳細
開発者はWSL2 + RTX 5090で100%ローカル推論を実現するため、サンドボックスを突破してvLLMインスタンスに到達する方法を確立しました。この解決策には複数のコンポーネントが含まれます:
- ホストiptables設定: Dockerブリッジからポート8000のvLLMへのトラフィックを許可
- Pod TCPリレー: Podのメインネームスペース内のカスタムPythonリレーで、サンドボックスveth → Dockerブリッジをブリッジング
- サンドボックスiptables注入:
nsenterを使用してサンドボックスのOUTPUTチェーンにACCEPTルールを注入し、デフォルトのREJECTを回避 - ツール呼び出し翻訳: vLLMからのストリーミングSSE応答を傍受し、バッファリングし、Nemotron 9Bの
<TOOLCALL>[...]</TOOLCALL>テキスト出力を解析し、リアルタイムでOpenAI互換のtool_callsに書き換えるカスタムゲートウェイを構築
この設定により、サンドボックス内のopencodeがNemotronを完全自律型エージェントとして使用できるようになります。すべてがローカルで実行され、データがマシンから流出することはありません。このセットアップは揮発性があります(WSL2の再起動でiptablesハックが消去されます)が、9Bモデルがロックダウンされた企業コンテナ内でターミナルコマンドを実行できるようにします。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

Swarm Orchestra v2プラグイン、エージェント間メッセージングを追加しClaudeコードエージェントチームの混乱を解消
Swarm Orchestraは、Claude Codeの実験的なTeamCreate機能の問題を解決するプラグインです。この機能はエージェントの暴走を引き起こす可能性があります。バージョン2では、PreToolUseフックによるエージェント間メッセージングと、/teammateスキルによる自己設定機能が追加されました。

Semble: コード検索AIエージェントがgrep+readより98%少ないトークンで実現
Sembleは、静的Model2Vec埋め込みとBM25を組み合わせ、CPUのみで動作するAIエージェント向けのオープンソースコード検索ライブラリです。リポジトリのインデックス作成に約250ms、クエリ応答に約1.5msかかり、NDCG@10で0.854を達成 — 137Mパラメータのトランスフォーマーの品質の99%を維持しながら、grep+readよりも98%少ないトークンを使用します。

Sentinel: Claude Code加入者向けセルフホスト型エージェントプラットフォーム
Sentinelは、既存のClaude Code OAuthトークン上で直接動作し、APIオーバーヘッドを排除する無料のオープンソースエージェントプラットフォームです。内蔵VNCによるリアルタイムブラウザ自動化を備えたクリーンなオペレーターUIを提供し、Gitゲーティング、セッショントレースログ、構造化階層メモリなどの機能を備えています。

Apple Neural EngineのリバースエンジニアリングによるMicroGPTモデルのトレーニング
開発者がAppleのNeural Engineの非公開APIをリバースエンジニアリングし、110MパラメータのMicroGPTモデルのトレーニングパイプラインを作成しました。M4 Macハードウェアで6.6 TFLOPs/wattの電力効率を達成しています。