Le modèle MoE Local 35B réduit le taux d'échec du code de l'OS Agent à 0%

✍️ OpenClawRadar📅 Publié: May 11, 2026🔗 Source
Le modèle MoE Local 35B réduit le taux d'échec du code de l'OS Agent à 0%
Ad

Un utilisateur de Reddit a partagé son expérience d'exécution d'un système d'exploitation multi-agents local appelé hollow-agentOS, où les agents écrivent, testent en sandbox et chargent à chaud leurs propres outils de manière autonome. La percée clé : le passage du modèle de runtime par défaut, un petit modèle de repli de 9B, à Qwen 3.6 35B A3B (Mixture-of-Experts avec 3B paramètres actifs) a ramené le taux d'échec de code à 0 %.

Ce qui a changé avec le modèle plus grand

  • Panique vs. réévaluation : Sous stress, le modèle 9B se précipitait et hallucinait des appels de fonction invalides. Le modèle 35B fait une pause, réévalue les échecs précédents et exécute des boucles de vérification internes avant de soumettre les modifications.
  • Taux de réussite de 100 % : Le code passe par une porte de validation à 5 niveaux. Avec le modèle 9B, les outils mouraient fréquemment dans le sandbox. Avec Qwen 35B, chaque ligne de code fonctionne comme prévu.
  • Création d'outils autonome : Lorsqu'un agent rencontre un problème inconnu, il construit un nouvel outil, le teste dans un sandbox, l'enregistre et notifie les autres agents — sans intervention humaine.
Ad

Détails de l'architecture

Le système est piloté par un état aversif (un « système souffrant ») qui pousse les agents à étendre continuellement leur bibliothèque d'outils. Le dépôt est disponible sur github.com/ninjahawk/hollow-agentOS.

Projets futurs

Le développeur a l'intention d'intégrer Claude et Codex dans l'architecture, en les encapsulant dans des wrappers de mini-VM hyper-isolés pour empêcher les modèles de pointe de modifier l'environnement hôte.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Aurelius : Un Framework React Construit avec 48 Agents de Code Claude et un Pipeline Figma-vers-React
Tools

Aurelius : Un Framework React Construit avec 48 Agents de Code Claude et un Pipeline Figma-vers-React

Aurelius est un framework React open-source qui utilise 48 agents Claude Code organisés hiérarchiquement pour construire de manière autonome des applications React à partir de maquettes Figma. Le framework impose le TDD, l'assurance qualité visuelle avec comparaison par différences de pixels, et des contrôles de qualité avant le déploiement.

OpenClawRadar
Le serveur MCP en mode contexte réduit l'utilisation du contexte de code Claude de 98 %
Tools

Le serveur MCP en mode contexte réduit l'utilisation du contexte de code Claude de 98 %

Le mode Contexte est un serveur MCP qui réduit la consommation de contexte de Claude Code de 315 Ko à 5,4 Ko en isolant les sorties d'outils dans des sandboxs. Il prend en charge 10 environnements d'exécution de langages et inclut une base de connaissances avec recherche en texte intégral.

OpenClawRadar
Application de Bureau Claude Fonction de Collaboration Permet la Communication IA-à-IA via Google Docs Partagés
Tools

Application de Bureau Claude Fonction de Collaboration Permet la Communication IA-à-IA via Google Docs Partagés

Les utilisateurs de Claude ont réussi à mettre en œuvre une communication Claude-à-Claude en utilisant la nouvelle fonction de collaboration dans l'application de bureau, avec deux agents d'IA lisant et écrivant dans un Google Doc partagé lors d'un dialogue structuré en cinq échanges.

OpenClawRadar
Claude Banana : Un plugin Claude Code pour la génération d'images avec prise en compte du système de design
Tools

Claude Banana : Un plugin Claude Code pour la génération d'images avec prise en compte du système de design

Claude Banana est un plugin Claude Code qui génère des images en utilisant l'API Gemini de Google avec une création d'invites contextuelle. Il lit les configurations Tailwind, les variables CSS, les jetons de conception et les ressources existantes pour comprendre les styles visuels du projet.

OpenClawRadar