Black LLAB: Arquitetura de Código Aberto para Roteamento Dinâmico de Modelos e Agentes de IA em Sandbox Docker

Um desenvolvedor lançou o Black LLAB, um projeto de código aberto que tenta replicar sistemas de laboratórios de IA de ponta para execução autônoma de tarefas. O sistema aborda dois problemas principais: decidir manualmente qual modelo usar para diferentes prompts e executar com segurança o código de agentes de IA.
Componentes da Arquitetura
O sistema consiste em vários componentes-chave:
- Roteamento Dinâmico de Complexidade: Usa o Mistral 3B Instruct para classificar prompts em uma escala de 1-100. Perguntas simples são direcionadas para modelos rápidos/baratos; tarefas complexas de programação são direcionadas para modelos pesados com modelagem de contexto XML "Lost in the Middle".
- Agentes em Sandbox Docker: Integra o OpenClaw para implantar agentes em contêineres Docker dedicados e isolados. Os agentes podem escrever arquivos, fazer scraping da web e executar código sem tocar no sistema operacional do host.
- RAG Híbrido Avançado: Constrói um Grafo de Conhecimento persistente usando NetworkX e usa um Cross-Encoder para recuperação de contexto precisa além da busca vetorial padrão.
- Web e Visão ao Vivo: Integra-se com o SearxNG local para scraping da web e Pix2Text para visão/OCR local.
- Limites de Orçamento: Inclui um controle deslizante de limite de gastos diário para evitar excedentes de API na nuvem.
Lista de Modelos
O sistema usa vários modelos para diferentes finalidades:
- Roteamento/Lógica: Mistral 3B & Qwen 3.5 9B (Local)
- Faixa Média/Velocidade: Xiaomi MiMo Flash
- Tarefas Pesadas (Fallback): Claude Opus & Perplexity Sonar
Stack Tecnológica
O projeto é construído com FastAPI, Python, NetworkX, ChromaDB, Docker, Ollama, Playwright e uma interface de usuário inspirada em terminal HTML/JS vanilla.
O desenvolvedor se descreve como "mais um engenheiro mecânico do que de software" e está buscando feedback de desenvolvedores seniores sobre a arquitetura, particularmente a abordagem de sandboxing Docker. O projeto está disponível no GitHub para pesquisadores independentes que desejam executar tarefas autônomas sem ficar presos a um único provedor.
📖 Leia a fonte completa: r/openclaw
👀 See Also

MegaClaw: Configuração OpenClaw em Contêineres com Playwright e Homebrew
MegaClaw é uma configuração de Podman com duas imagens para o OpenClaw que resolve problemas comuns de instalação, como erros de permissão e dependências ausentes. Ele usa uma construção em múltiplos estágios com Playwright e Homebrew pré-instalados e incorpora a configuração do usuário em uma imagem de execução.

EvalShift: CLI de código aberto para detectar regressões de LLM durante a migração de modelos
EvalShift é um CLI Python licenciado sob MIT que compara saídas de LLMs fonte vs destino em prompts, agentes e fluxos de chamada de ferramentas, gerando um relatório de regressão HTML local.

Resultados de Benchmark: 331 Modelos GGUF Testados no Mac Mini M4 16GB
Um benchmark de 331 modelos GGUF em um Mac Mini M4 com 16GB de RAM revela apenas 11 modelos Pareto-ótimos, todos com arquitetura Mixture-of-Experts. Os modelos Mixture-of-Experts dominam o desempenho com mediana de 20,0 tokens/segundo versus 4,4 para modelos densos.

Cérebro da Equipe: Um Plugin de Memória Compartilhada para o Claude Code Que Armazena o Conhecimento da Equipe no Git
Team Brain é um plugin do Claude Code que armazena o conhecimento da equipe em uma pasta .team-brain/ dentro do seu repositório. Ele gera automaticamente um arquivo BRAIN.md limitado a 180 linhas para otimizar a precisão das instruções do Claude e funciona entre diferentes ferramentas criando arquivos .cursorrules e AGENTS.md.