LLAB Noir : Architecture Open-Source pour le Routage Dynamique de Modèles et les Agents IA en Sandbox Docker

Un développeur a publié Black LLAB, un projet open-source qui tente de reproduire les systèmes de laboratoires d'IA de pointe pour l'exécution autonome de tâches. Le système aborde deux problèmes principaux : décider manuellement quel modèle utiliser pour différents prompts et exécuter en toute sécurité le code des agents d'IA.
Composants de l'architecture
Le système se compose de plusieurs composants clés :
- Routage dynamique de complexité : Utilise Mistral 3B Instruct pour évaluer les prompts sur une échelle de 1 à 100. Les questions simples sont routées vers des modèles rapides/économiques ; les tâches de codage complexes sont routées vers des modèles lourds avec une mise en forme de contexte XML "Lost in the Middle".
- Agents en bac à sable Docker : Intègre OpenClaw pour déployer des agents dans des conteneurs Docker dédiés et isolés. Les agents peuvent écrire des fichiers, scraper le web et exécuter du code sans toucher au système d'exploitation hôte.
- RAG hybride avancé : Construit un graphe de connaissances persistant avec NetworkX et utilise un Cross-Encoder pour une récupération de contexte précise au-delà de la recherche vectorielle standard.
- Web et vision en direct : S'intègre avec SearxNG local pour le scraping web et Pix2Text pour la vision/OCR locale.
- Limites budgétaires : Inclut un curseur de limite de dépenses quotidienne pour éviter les dépassements d'API cloud.
Gamme de modèles
Le système utilise plusieurs modèles à différentes fins :
- Routage/Logique : Mistral 3B & Qwen 3.5 9B (Local)
- Milieu de gamme/Vitesse : Xiaomi MiMo Flash
- Travail intensif (Secours) : Claude Opus & Perplexity Sonar
Pile technologique
Le projet est construit avec FastAPI, Python, NetworkX, ChromaDB, Docker, Ollama, Playwright et une interface utilisateur inspirée d'un terminal HTML/JS vanilla.
Le développeur se décrit comme "plus un ingénieur mécanique qu'un développeur logiciel" et recherche des retours de développeurs seniors sur l'architecture, en particulier l'approche du bac à sable Docker. Le projet est disponible sur GitHub pour les chercheurs indépendants qui souhaitent exécuter des tâches autonomes sans être liés à un seul fournisseur.
📖 Lire la source complète : r/openclaw
👀 See Also

Exécuter deux agents Claude Code sur le même dépôt avec Git Worktrees
Un utilisateur de Reddit explique comment exécuter plusieurs agents Claude Code en parallèle sur la même base de code en utilisant git worktrees, évitant ainsi les conflits de fichiers et permettant des sessions d'agents indépendantes.

La compétence Claude Code génère des captures d'écran de l'App Store en utilisant l'IA Gemini.
Une nouvelle compétence Claude Code appelée /aso-cosmicmeta-ss crée des captures d'écran pour l'App Store et Google Play via un flux de travail en 6 phases qui analyse les bases de code et utilise Gemini AI pour l'amélioration. La compétence inclut une étape de validation pour détecter les problèmes de mise en page avant d'utiliser les crédits API.

Clawdbot dévoile de nouvelles fonctionnalités avec l'abonnement Pro
Clawdbot lance un abonnement 'Pro', offrant des capacités améliorées aux utilisateurs souhaitant maximiser le potentiel de l'automatisation dans les environnements de codage. Plongez dans les dernières fonctionnalités et les perspectives de la communauté de r/clawdbot.

Pleng : Plateforme Cloud Auto-hébergée avec Gestion d'Infrastructure Pilotée par l'IA
Pleng est une plateforme cloud auto-hébergée sous licence AGPL-3.0 qui utilise un agent IA (actuellement Claude) pour gérer l'infrastructure via des commandes de bot Telegram. Elle déploie à partir de dépôts GitHub ou de répertoires locaux avec routage Traefik automatisé, SSL Let's Encrypt et des analyses de base.