Contornando o Isolamento da Sandbox NemoClaw para o Agente Local Nemotron 9B

✍️ OpenClawRadar📅 Publicado: March 18, 2026🔗 Source
Contornando o Isolamento da Sandbox NemoClaw para o Agente Local Nemotron 9B
Ad

Contorno Local do NemoClaw para Inferência Totalmente Local

Um desenvolvedor documentou um método para contornar o isolamento da sandbox do NemoClaw da NVIDIA e executar um agente de IA totalmente local. O NemoClaw, lançado na GTC, é uma sandbox empresarial para agentes de IA construída sobre OpenShell (k3s + Landlock + seccomp) que, por padrão, espera conexões de API na nuvem e restringe fortemente o networking local.

Ad

Detalhes da Implementação Técnica

O desenvolvedor queria inferência 100% local no WSL2 + RTX 5090 e perfurou a sandbox para alcançar uma instância vLLM. A solução envolveu múltiplos componentes:

  • Configuração do iptables do host: Permitiu tráfego da ponte Docker para o vLLM na porta 8000
  • Retransmissor TCP do Pod: Retransmissor Python personalizado no namespace principal do Pod conectando a veth da sandbox → ponte Docker
  • Injeção do iptables da sandbox: Usou nsenter para injetar uma regra ACCEPT na cadeia OUTPUT da sandbox, contornando a REJECT padrão
  • Tradução de Chamadas de Ferramentas: Construiu um Gateway personalizado que intercepta a resposta de streaming SSE do vLLM, a armazena em buffer, analisa a saída de texto <TOOLCALL>[...]</TOOLCALL> do Nemotron 9B e a reescreve em tool_calls compatíveis com OpenAI em tempo real

Esta configuração permite que o opencode dentro da sandbox use o Nemotron como um agente totalmente autônomo. Tudo é executado localmente sem que nenhum dado saia da máquina. A configuração é volátil (reinicializações do WSL2 apagam os hacks do iptables), mas permite que um modelo de 9B execute comandos de terminal dentro de um container empresarial bloqueado.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Redutor de Logs MCP Server Reduz Uso de Tokens Quando o Claude Code Lê Logs
Tools

Redutor de Logs MCP Server Reduz Uso de Tokens Quando o Claude Code Lê Logs

Log Reducer é um servidor MCP que processa arquivos de log no lado do servidor antes de enviar a saída reduzida para o Claude Code, evitando logs brutos na janela de contexto. Ele aplica 19 transformações determinísticas que comprimem logs em 50-90%, com um log de 2000 linhas representando mais de 20.000 tokens removidos das sessões.

OpenClawRadar
Netflix Lança VOID: Modelo de Exclusão de Objetos e Interações em Vídeo no Hugging Face
Tools

Netflix Lança VOID: Modelo de Exclusão de Objetos e Interações em Vídeo no Hugging Face

A Netflix lançou o VOID, um modelo de inpainting de vídeo que remove objetos de vídeos juntamente com todas as interações físicas que eles induzem, incluindo objetos caindo e itens deslocados. O modelo requer uma GPU com 40GB+ de VRAM e usa condicionamento quadmask com dois arquivos de checkpoint para diferentes níveis de refinamento.

OpenClawRadar
Mind Keg MCP: Memória Persistente para Claude Code e Agentes Compatíveis com MCP
Tools

Mind Keg MCP: Memória Persistente para Claude Code e Agentes Compatíveis com MCP

Mind Keg MCP v0.1.1 é um servidor MCP de código aberto que fornece memória persistente para Claude Code e outros agentes compatíveis com MCP. Ele armazena aprendizados localmente via SQLite e os recupera através de busca semântica, permitindo que assistentes de codificação de IA lembrem o contexto entre sessões.

OpenClawRadar
Claude Opus 4.6: Um Modelo para Tarefas de Engenharia Sustentadas
Tools

Claude Opus 4.6: Um Modelo para Tarefas de Engenharia Sustentadas

Claude Opus 4.6 traz foco sustentado para projetos de longo prazo, apoiando tarefas de vários dias com recursos como contexto ultra-longo e pensamento adaptativo.

OpenClawRadar