NemoClaw 샌드박스 격리 우회를 통한 로컬 Nemotron 9B 에이전트 실행

완전 로컬 추론을 위한 로컬 NemoClaw 우회 방법
한 개발자가 NVIDIA의 NemoClaw 샌드박스 격리를 우회하여 완전 로컬 AI 에이전트를 실행하는 방법을 문서화했습니다. GTC에서 출시된 NemoClaw는 OpenShell(k3s + Landlock + seccomp) 기반의 엔터프라이즈 AI 에이전트 샌드박스로, 기본적으로 클라우드 API 연결을 기대하며 로컬 네트워킹을 엄격히 제한합니다.
기술 구현 세부사항
해당 개발자는 WSL2 + RTX 5090에서 100% 로컬 추론을 원했으며, 샌드박스를 뚫고 vLLM 인스턴스에 도달했습니다. 솔루션에는 여러 구성 요소가 포함되었습니다:
- 호스트 iptables 구성: Docker 브리지에서 포트 8000의 vLLM으로의 트래픽 허용
- Pod TCP 릴레이: Pod의 메인 네임스페이스에서 샌드박스 veth → Docker 브리지를 연결하는 사용자 정의 Python 릴레이
- 샌드박스 iptables 주입:
nsenter를 사용하여 샌드박스의 OUTPUT 체인에 ACCEPT 규칙을 주입하여 기본 REJECT 우회 - 도구 호출 변환: vLLM의 스트리밍 SSE 응답을 가로채고 버퍼링하며, Nemotron 9B의
<TOOLCALL>[...]</TOOLCALL>텍스트 출력을 파싱하여 실시간으로 OpenAI 호환tool_calls로 재작성하는 사용자 정의 게이트웨이 구축
이 구성은 샌드박스 내의 opencode가 Nemotron을 완전 자율 에이전트로 사용할 수 있게 합니다. 모든 것이 로컬에서 실행되며 데이터가 기기를 떠나지 않습니다. 설정은 휘발성(WSL2 재부팅 시 iptables 해킹이 초기화됨)이지만, 9B 모델이 잠긴 엔터프라이즈 컨테이너 내에서 터미널 명령을 실행할 수 있게 합니다.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

올로지: 다중 에이전트 AI 시스템을 위한 선언적 오케스트레이션 런타임
Orloj v0.1.0는 GitOps와 함께 YAML 매니페스트로 AI 에이전트, 도구, 정책 및 워크플로우를 정의할 수 있는 오픈소스 오케스트레이션 런타임입니다. 프로덕션 다중 에이전트 시스템의 스케줄링, 실행, 거버넌스 및 안정성을 처리합니다.

Statespace: 마크다운으로 OpenClaw 에이전트를 위한 인터랙티브 웹 앱 구축하기
Statespace는 OpenClaw 에이전트가 순수 마크다운을 사용하여 탐색하고 상호작용할 수 있는 AI 친화적인 웹 앱을 구축하고 공유하기 위한 무료 오픈소스 프레임워크입니다. 마크다운 파일에 에이전트가 HTTP를 통해 접근하는 도구, 컴포넌트, 지침을 정의할 수 있습니다.

테스트릴: 클로드 코드를 활용한 프로그래매틱 데모 비디오 생성
Testreel은 JSON, YAML 또는 Playwright 상호작용 설명에서 세련된 제품 데모 비디오를 생성하는 npm 패키지입니다. 커서 오버레이, 클릭 리플, 그라데이션 배경이 포함된 webm/mp4/gif 비디오를 생성합니다.

MemAware 벤치마크, AI 기억력을 키워드 검색 이상으로 테스트하다
MemAware는 3가지 난이도에 걸친 900개의 질문으로 구성된 벤치마크로, 메모리가 있는 AI 어시스턴트가 힌트가 없는 쿼리에서 관련 컨텍스트를 표면화할 수 있는지 테스트합니다. 결과는 BM25 검색이 메모리 없음 대비 2.8% vs 0.8%로 점수를 기록한 반면, 벡터 검색은 도메인 간 연결에서 0.7%로 떨어졌음을 보여줍니다.