OpenClaw 4.1 & Gemma 4 Stack : Architecture Hybride

Architecture hybride d'agent

La configuration recommandée utilise une approche hybride : une API lourde comme Claude ou Miniax comme orchestrateur principal ("Cerveau principal") qui délègue le codage, les tâches répétitives et le traitement des données à des sous-agents locaux exécutant Gemma 4 via Ollama. Le modèle Gemma 4 26B Mixture of Experts (MoE) est mis en avant comme le point idéal actuel, n'activant qu'environ 3,8 milliards de paramètres pendant l'inférence tout en prenant en charge les sorties JSON structurées, l'appel de fonctions et la planification multi-étapes.

Turbo Quant et matériel

L'innovation "Turbo Quant" de Google rend les modèles 8 fois plus petits et 6 fois plus rapides. Le modèle 26B utiliserait environ 16,9 Go de mémoire, lui permettant de fonctionner sur un Mac Mini de base ou sur plusieurs machines via un réseau Wi-Fi. Le post mentionne Atomic Bot comme un outil capable de récupérer des modèles locaux optimisés par Turbo Quant et de les connecter à OpenClaw en un seul clic.

Correctifs de configuration critiques

La source identifie une erreur courante dans l'appel d'outils des modèles locaux : utiliser l'URL compatible OpenAI (/v1) lors de la configuration d'Ollama dans OpenClaw. La solution est de pointer OpenClaw vers l'URL de base simple d'Ollama : http://127.0.0.1:11434. Cela exploite la prise en charge native de l'API Ollama par OpenClaw pour un streaming amélioré et un appel d'outils plus fiable.

Gestion de la fenêtre contextuelle

Pour les workflows agentiques, garantir une grande fenêtre contextuelle est crucial. Le post conseille de démarrer Ollama avec un drapeau de contexte : Ollama run [modèle] --context-length=32768. Alternativement, des versions spécifiques de 18 Go ou 20 Go de Gemma 4 avec des fenêtres contextuelles natives allant jusqu'à 256K sont notées comme vitales pour le système de mémoire d'OpenClaw.

Bug connu et contournement

OpenClaw 4.1 a un bug d'interface où le passage d'un modèle Ollama local à une API cloud (comme OpenRouter) dans le tableau de bord peut provoquer un échec, entraînant une réponse "heartbeat". Le contournement est de revenir au modèle d'origine dans le menu d'intégration ou de demander à Claude de réparer la passerelle.

📖 Read the full source: r/openclaw