Les modèles à poids ouvert de moins de 100 Go ne peuvent pas surpasser Claude Haiku sur les benchmarks de codage.

✍️ OpenClawRadar📅 Publié: February 26, 2026🔗 Source
Les modèles à poids ouvert de moins de 100 Go ne peuvent pas surpasser Claude Haiku sur les benchmarks de codage.
Ad

Une analyse récente des modèles de langage à poids ouvert révèle un écart de performance significatif par rapport au Claude Haiku d'Anthropic sur les benchmarks de codage. La comparaison a été réalisée en utilisant des paramètres de test spécifiques et des exigences de mémoire.

Méthodologie de benchmark

L'évaluation a comparé les modèles sur deux benchmarks de codage : LiveBench (janvier 2026) et Arena Code/WebDev. Les tests ont été effectués contre Claude Haiku 4.5 avec les capacités de réflexion activées. Les modèles ont été représentés graphiquement en fonction des exigences de mémoire pour un déploiement local.

Spécifications techniques

  • Quantification : Q4_K_M
  • Longueur de contexte : 32K
  • Cache KV : q8_0
  • Estimation VRAM : Calculée à l'aide de la calculatrice personnalisée de l'auteur
Ad

Principales conclusions

Aucun modèle à poids ouvert nécessitant moins de 100 Go de mémoire ne s'approche des performances de Claude Haiku sur l'un ou l'autre benchmark. Le concurrent le plus proche est Minimax M2.5, qui nécessite environ 136 Go de mémoire et correspond approximativement aux performances de Haiku sur les deux benchmarks.

L'analyse met en lumière l'écart actuel entre les modèles propriétaires et à poids ouvert dans la catégorie des moins de 100 Go pour les tâches de codage. L'auteur exprime sa frustration face à cette limitation et appelle au développement de modèles plus petits qui pourraient au moins égaler les capacités de Haiku.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Claude Cowork pour Windows ARM64 publié avec un vérificateur de compatibilité
News

Claude Cowork pour Windows ARM64 publié avec un vérificateur de compatibilité

Anthropic a rendu Claude Cowork disponible pour les appareils Windows ARM64, nécessitant Windows 11 Pro avec Hyper-V et la virtualisation activée. L'entreprise fournit un outil de vérification de compatibilité EXE pour vérifier les exigences système.

OpenClawRadar
Claude.ai actuellement hors service, erreurs API en hausse — 28 avril 2026
News

Claude.ai actuellement hors service, erreurs API en hausse — 28 avril 2026

Une mise à jour automatique déclenchée depuis la page de statut officielle de Claude signale que Claude.ai est indisponible et que l'API connaît des taux d'erreur élevés depuis le 28 avril 2026 à 17:51:36 UTC.

OpenClawRadar
Abonnés de l'UE signalent des limites d'utilisation non divulguées de Claude Pro – Possible violation du droit de la consommation
News

Abonnés de l'UE signalent des limites d'utilisation non divulguées de Claude Pro – Possible violation du droit de la consommation

Un post Reddit détaille comment le marketing de Claude Pro promet « sans limites », mais les utilisateurs de l'UE subissent des frais supplémentaires et des plafonds de session non divulgués, ce qui pourrait enfreindre les directives européennes sur la protection des consommateurs.

OpenClawRadar
Un centre de données IA en Géorgie a utilisé 29 millions de gallons d’eau non comptabilisée
News

Un centre de données IA en Géorgie a utilisé 29 millions de gallons d’eau non comptabilisée

Le campus QTS de Fayetteville a puisé 29 millions de gallons via deux raccordements non autorisés pendant 15 mois, provoquant des plaintes de basse pression. Le comté a renoncé aux amendes et facturé 147 000 $ de manière rétroactive.

OpenClawRadar