로컬 vLLM으로 NemoClaw 실행하기: 설정 노트 및 에이전트 엔지니어링 관찰

vLLM을 이용한 로컬 NemoClaw 설정
개발자가 WSL2에서 vLLM을 사용하여 로컬 Nemotron 9B v2 모델과 함께 NVIDIA의 샌드박스 AI 에이전트 플랫폼인 NemoClaw을 실행한 경험을 공유했습니다. 이 설정은 jieunl24의 NemoClaw 포크를 기반으로 합니다.
주요 기술 세부사항
추론 라우팅: NemoClaw의 추론 라우팅은 깔끔한 경로를 따릅니다: inference.local → gateway → vLLM. 그러나 초기 온보딩 버그로 인해 3계층 네트워크 해킹이 필요했으며, 이는 이후 PR #412를 통해 수정되었습니다.
파서 호환성: 내장된 vLLM 파서(qwen3_coder, nemotron_v3)는 Nemotron v2 모델과 호환되지 않습니다. 대신 NeMo 저장소의 NVIDIA 공식 플러그인 파서를 사용해야 합니다.
에이전트 엔지니어링 격차: 에이전트 플랫폼으로서의 OpenClaw는 견고한 인프라를 제공하지만 최소한의 프롬프트 엔지니어링만 포함하고 있습니다. '모델이 텍스트를 제공한다'와 '에이전트가 유용한 작업을 수행한다' 사이의 격차는 주로 모델 능력의 한계보다는 스캐폴딩에 관한 것입니다.
참고 자료
- 아키텍처, vLLM 파서 설정, 에이전트 엔지니어링 관찰을 다루는 블로그 게시물: https://github.com/soy-tuber/nemoclaw-local-inference-guide/blob/master/BLOG-openclaw-agent-engineering.md
- 추론.local 라우팅 및 네트워크 해킹 없이 설정하는 가이드 (V2): https://github.com/soy-tuber/nemoclaw-local-inference-guide
- 원본 NemoClaw 이슈 #315: https://github.com/NVIDIA/NemoClaw/issues/315
이 설정은 AI 에이전트 플랫폼의 실용적인 로컬 배포를 보여주며, 기술 구현 세부사항과 에이전트 엔지니어링의 지속적인 과제를 모두 강조합니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

클로드 코드용 디자인 스튜디오 플러그인, 9가지 역할과 16개 명령어로 구성된 가상 디자인 팀 추가
Design Studio라는 새로운 Claude Code 플러그인은 9개의 전문가 역할, 16개의 슬래시 명령어, 5개의 에이전트로 구성된 완전한 디자인 팀을 시뮬레이션합니다. 기술 스택을 자동으로 감지하며 참조 파일에 걸쳐 8,000줄 이상의 디자인 지식을 포함합니다.

그래프 컴포즈: 시각적 빌더와 AI가 지원되는 호스팅형 시간 기반 워크플로우
Graph Compose는 Temporal에서 API 워크플로우를 오케스트레이션하는 호스팅 플랫폼으로, React Flow 시각적 빌더, TypeScript SDK, 일반 영어를 그래프로 변환하는 AI 어시스턴트라는 세 가지 빌드 방법을 통해 워크플로우를 JSON 그래프로 정의할 수 있습니다.

MCP 서버, Claude를 스튜디오 음향 분석을 위한 Room EQ Wizard에 연결합니다
오픈소스 MCP 서버가 Claude AI에 Room EQ Wizard 제어 기능을 부여하여 자동화된 스튜디오 모니터 보정 및 실내 음향 분석을 가능하게 합니다. 이 도구는 측정 제어, 신호 생성, SPL 미터링, EQ 관리용 27개의 MCP 도구를 포함합니다.

코딩-플래시카드: Rust, SQLite, Godot, Wolfram 언어를 위한 800개 이상의 Anki 카드
Rust, SQLite, Godot, Wolfram Language를 처음부터 학습할 수 있는 800개 이상의 마크다운 플래시카드, Anki 덱 또는 PDF로 변환하는 스크립트 포함