Système de Haïku Multi-Agent Égale Claude Opus sur un Problème de Théorie des Nombres Complexes à un Coût 15 Fois Moindre

✍️ OpenClawRadar📅 Publié: March 7, 2026🔗 Source
Système de Haïku Multi-Agent Égale Claude Opus sur un Problème de Théorie des Nombres Complexes à un Coût 15 Fois Moindre
Ad

Configuration expérimentale et résultats

Un utilisateur de Reddit a mené un test comparatif entre deux configurations du modèle Claude sur un problème difficile de théorie des nombres. Le problème nécessitait de prouver que pour un nombre premier impair p, la somme 1^(p-1) + 2^(p-1) + ... + (p-1)^(p-1) est congrue à -1 (mod p), en utilisant le petit théorème de Fermat et les propriétés des racines primitives.

Deux configurations ont été testées :

  • Configuration X (Opus seul) : Claude Opus 4.5 avec max_tokens : 2048, sans vérificateur
  • Configuration Y (multi-agent Haiku) : Un générateur Haiku produit la preuve complète, un second vérificateur Haiku contrôle chaque étape, avec deux passes si le vérificateur signale quelque chose, max_tokens : 1024 par appel

Notation et performance

Les deux configurations ont obtenu un score de 4/4 selon cette grille :

  • Invoque correctement le petit théorème de Fermat
  • Gère correctement l'argument des racines primitives
  • La sommation sur le système complet de résidus est valide
  • La conclusion de congruence suit correctement

Le vérificateur Haiku a retourné VÉRIFIÉ sans désaccord. Métriques de performance :

  • Opus seul : ~8,7 secondes, score 4/4
  • Haiku + vérificateur : ~10,9 secondes, score 4/4
Ad

Analyse des coûts

Les implications économiques sont significatives :

  • Opus seul : 0,075 $/1000 tokens × ~800 tokens = ~0,06 $ par requête
  • Haiku + Haiku : 0,0025 $/1000 tokens × ~1600 tokens = ~0,004 $ par requête

Cela représente environ 15 fois moins cher pour des résultats identiques sur ce problème. Le problème a été décrit comme "vraiment difficile" et pas évident dans les données d'entraînement comme des preuves plus simples.

La source note que sur des problèmes propres où le petit théorème de Fermat fait le gros du travail (chaque a^(p-1) ≡ 1, somme de (p-1) uns, donne p-1 ≡ -1), le modèle avec vérificateur ajoute environ 17 % de temps supplémentaire pour confirmer l'exactitude. Ce modèle est particulièrement utile pour les problèmes où le générateur pourrait trébucher avec des hésitations de quantification ou de l'algèbre hallucinée.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

🦀
Tools

Spine Swarm : Système d'IA Multi-Agents sur Toile Visuelle pour Projets Non-Codés

Spine Swarm est un système multi-agents qui fonctionne sur un canevas visuel infini pour mener à bien des projets complexes non liés au codage, tels que l'analyse concurrentielle, la modélisation financière, les audits SEO, les pitch decks et les prototypes interactifs. Le système utilise des blocs comme abstractions au-dessus des modèles d'IA, qui peuvent être connectés pour transmettre le contexte entre différents types de modèles.

OpenClawRadar
L'Approche de Cursor pour une Recherche Rapide d'Expressions Régulières pour les Agents IA
Tools

L'Approche de Cursor pour une Recherche Rapide d'Expressions Régulières pour les Agents IA

Cursor développe une recherche d'expressions régulières indexée pour résoudre les problèmes de performance dans les monorepos de grande taille où ripgrep peut prendre plus de 15 secondes, en utilisant des index inversés avec des n-grammes basés sur des recherches de 1993 par Zobel, Moffat et Sacks-Davis.

OpenClawRadar
DeepClaude remplace le backend Anthropic de Claude Code par DeepSeek V4 Pro à un coût 17 fois inférieur
Tools

DeepClaude remplace le backend Anthropic de Claude Code par DeepSeek V4 Pro à un coût 17 fois inférieur

Un script qui réécrit les variables d'environnement de Claude Code pour router tous les appels de la boucle agent via DeepSeek V4 Pro, OpenRouter ou Fireworks AI — même UX, 0,87 $/M tokens de sortie contre 15 $/M.

OpenClawRadar
Claude Code Container offre un isolement Docker sans configuration pour Claude Code
Tools

Claude Code Container offre un isolement Docker sans configuration pour Claude Code

Claude Code Container (ccc) est un outil gratuit et open-source qui crée automatiquement des conteneurs Docker par projet pour Claude Code avec une isolation complète et une configuration zéro. Il transmet les variables d'environnement de l'hôte, monte les clés SSH, fournit un proxy localhost transparent et inclut Chromium avec chrome-devtools MCP préconfiguré.

OpenClawRadar