Benchmark : Gemma4 12B contre Qwen3 8B quantifié sur Mac Mini 24 Go

✍️ OpenClawRadar📅 Publié: April 21, 2026🔗 Source

Comparaison des performances de deux modèles locaux pour OpenClaw

Un développeur a réalisé un test comparatif entre Gemma4 12B et Qwen3:8b-q4_K_M sur un Mac Mini 24GB. Le test a utilisé deux prompts : "expliquer comment fonctionne un carburateur" et "écrire une fonction Python pour détecter les fuites de mémoire". Claude a aidé à écrire une commande pour extraire les mesures de la sortie.

Résultats des benchmarks

Tâche d'explication du carburateur :

Qwen3:8b-q4_K_M : Évaluation du prompt : 89,8 t/s, Génération : 19,6 t/s
Gemma4 : Évaluation du prompt : 20,8 t/s, Génération : 27,6 t/s

Tâche de codage Python :

Qwen3:8b-q4_K_M : Évaluation du prompt : 133,8 t/s, Génération : 18,7 t/s
Gemma4 : Évaluation du prompt : 26,1 t/s, Génération : 26,1 t/s

Principales conclusions

Qwen3 traite les prompts 4 à 5 fois plus vite que Gemma4, ce qui est important pour OpenClaw en raison des prompts de contexte généralement volumineux envoyés. Gemma4 génère la sortie légèrement plus rapidement. Pour de nombreuses utilisations d'OpenClaw, Qwen3 l'emporte en vitesse. Le développeur note que Gemma4 est un modèle 12B et pourrait produire une sortie légèrement meilleure, bien que cela n'ait pas été testé.

Le développeur exécute diverses tâches sur des modèles locaux, y compris des tâches cron, la surveillance de l'activité, l'indexation de la mémoire, et fait souvent appel à OpenClaw pour lancer des sous-agents exécutant des modèles locaux. Il teste Gemma4 comme modèle local pour toutes ces tâches en arrière-plan, mais ne s'attend pas à remarquer des différences de performance puisque celles-ci s'exécutent en arrière-plan.

📖 Read the full source: r/openclaw

👀 See Also

Tools

Réduisez de 90 % les coûts des sessions de codage IA avec l'indexation de code basée sur des graphes

Un développeur a construit une base de données graphe locale qui indexe un codebase à l'aide de résumés générés par LLM, réduisant les coûts des sessions Claude Code de 6 à 10 dollars à quelques centimes en évitant les relectures redondantes de fichiers.

May 10, 2026, 04:19 PM UTC

OpenClawRadar

Tools

Latence zéro : une couche de mémoire persistante pour les agents IA via MCP

0Latency est un serveur MCP qui ajoute une mémoire persistante à Claude et à d'autres agents d'IA, stockant les souvenirs entre les sessions pour éviter la perte de contexte. Il fonctionne nativement avec Claude Desktop, Claude Code, claude.ai, GPT, Gemini, Cursor et tout agent compatible MCP.

Apr 13, 2026, 04:45 PM UTC

OpenClawRadar

Tools

Plugin open-source Claude Code simule le Bureau du Directeur des Données et de l'IA avec 22 agents spécialisés.

Un plugin open-source Claude Code appelé AI CDAIO Office utilise 22 agents d'IA spécialisés pour simuler un bureau complet du Chief Data & AI Office, générant des fichiers réels PPTX, DOCX et XLSX pour des documents stratégiques, des cadres de gouvernance et des supports pour le conseil d'administration.

Mar 18, 2026, 08:45 PM UTC

OpenClawRadar

Tools

Bibliothèque gratuite de 789 compétences téléchargeables pour Claude Code

clskills.in est un centre de recherche proposant 789 fichiers de compétences .md téléchargeables pour Claude Code, répartis dans plus de 60 catégories incluant les plateformes d'entreprise, les langages de programmation et les outils DevOps. Chaque téléchargement comprend un README et une invite d'installation automatique.

Mar 23, 2026, 08:45 PM UTC

OpenClawRadar