블랙 LLAB: 동적 모델 라우팅 및 도커 샌드박스 AI 에이전트를 위한 오픈소스 아키텍처

한 개발자가 자율적 작업 실행을 위한 최첨단 AI 연구실 시스템을 재현하려는 오픈소스 프로젝트인 Black LLAB를 공개했습니다. 이 시스템은 서로 다른 프롬프트에 어떤 모델을 사용할지 수동으로 결정하는 문제와 AI 에이전트 코드를 안전하게 실행하는 문제라는 두 가지 주요 문제를 해결합니다.
아키텍처 구성 요소
이 시스템은 다음과 같은 주요 구성 요소로 이루어져 있습니다:
- 동적 복잡도 라우팅: Mistral 3B Instruct를 사용해 프롬프트를 1-100점 척도로 평가합니다. 간단한 질문은 빠르고 저렴한 모델로 라우팅되고, 복잡한 코딩 작업은 "Lost in the Middle" XML 컨텍스트 형성을 지원하는 고성능 모델로 라우팅됩니다.
- Docker 샌드박스 에이전트: OpenClaw를 통합하여 에이전트를 전용 격리 Docker 컨테이너에 배포합니다. 에이전트는 호스트 OS에 접촉하지 않고 파일을 작성하고, 웹을 스크래핑하며, 코드를 실행할 수 있습니다.
- 고급 하이브리드 RAG: NetworkX를 사용해 지속적인 지식 그래프를 구축하고, 표준 벡터 검색을 넘어 정확한 컨텍스트 검색을 위해 Cross-Encoder를 사용합니다.
- 실시간 웹 및 비전: 웹 스크래핑을 위해 로컬 SearxNG와, 로컬 비전/OCR을 위해 Pix2Text와 통합됩니다.
- 예산 가드레일: 클라우드 API 초과 사용을 방지하기 위한 일일 지출 한도 슬라이더를 포함합니다.
모델 라인업
이 시스템은 다양한 목적을 위해 여러 모델을 사용합니다:
- 라우팅/로직: Mistral 3B & Qwen 3.5 9B (로컬)
- 중간급/속도: Xiaomi MiMo Flash
- 고성능 작업 (페일오버): Claude Opus & Perplexity Sonar
기술 스택
이 프로젝트는 FastAPI, Python, NetworkX, ChromaDB, Docker, Ollama, Playwright 및 바닐라 HTML/JS 터미널 스타일 UI로 구축되었습니다.
개발자는 자신을 "소프트웨어 엔지니어보다는 기계 엔지니어에 가깝다"고 설명하며, 특히 Docker 샌드박싱 접근 방식에 대한 시니어 개발자의 피드백을 구하고 있습니다. 이 프로젝트는 단일 제공업체에 종속되지 않고 자율 작업을 실행하려는 독립 연구자를 위해 GitHub에서 이용 가능합니다.
📖 Read the full source: r/openclaw
👀 See Also

언슬로스 스튜디오는 로컬 AI 파인튜닝 시 2배 빠른 학습 속도와 70% 감소된 VRAM 사용량을 가능하게 합니다.
Unsloth Studio는 2배 빠른 학습 속도와 70% VRAM 감소를 제공하며 로컬 하드웨어에서 언어 모델을 학습 및 파인튜닝할 수 있는 도구를 제공합니다. Ollama와 함께 사용하기 위해 GGUF 형식으로 모델을 내보내는 것을 지원하며, RTX 4090과 같은 24GB 하드웨어에서 완전한 로컬 AI 코딩 워크플로우를 가능하게 합니다.

OpenClaw 기술로 접근성 트리 토큰을 60만 개에서 1,300개로 줄였습니다
개발자가 접근성 트리에서 토큰 과다 문제를 해결하는 OpenClaw 스킬을 만들었습니다. 이 스킬은 머신러닝 기반 요소 순위 매기기를 사용해 LLM에 데이터를 보내기 전에 요소를 정리합니다.

해안: 다중 로컬호스트 환경을 실행하기 위한 컨테이너화된 호스트
Coasts는 Docker-in-Docker 솔루션으로, 복잡한 스크립팅 없이도 여러 로컬호스트 환경을 동시에 실행하고 포트 충돌, 비밀 정보, 볼륨 토폴로지를 처리하는 문제를 해결합니다.

라이트피드 익스트랙터: LLM을 활용한 강력한 웹 데이터 추출을 위한 타입스크립트 라이브러리
Lightfeed Extractor는 LLM을 사용하여 원시 HTML에서 검증된 구조화 데이터까지 전체 파이프라인을 처리하는 TypeScript 라이브러리로, HTML-마크다운 변환, Zod 스키마 검증, JSON 복구, 내장 Playwright 브라우저 자동화 등의 기능을 제공합니다.