Titre de l'article : Homme des cavernes vs consigne « soyez bref » : évaluation comparative des prompts de compression pour Claude

✍️ OpenClawRadar📅 Publié: April 29, 2026🔗 Source

Un développeur a comparé caveman (le prompt de compression abrégée populaire) au simple prompt 'soyez bref.' pour voir si la complexité supplémentaire en vaut la peine. Le test a exécuté 24 prompts de développement dans 6 catégories, comparant 5 bras : baseline, 'soyez bref.', caveman lite, caveman full et caveman ultra. Les sorties ont été évaluées par une instance distincte de Claude à l'aide de grilles par prompt.

Résultats du benchmark

Baseline : score moyen 0,985, tokens moyens 636
'soyez bref.' : score moyen 0,985, tokens moyens 419
Caveman lite : score moyen 0,976, tokens moyens 401
Caveman full : score moyen 0,975, tokens moyens 404
Caveman ultra : score moyen 0,970, tokens moyens 449

La version en deux mots a égalé caveman en compression comme en qualité. Cependant, la valeur de caveman réside ailleurs : structure de sortie cohérente, changement de mode, et l'échappement de sécurité pour les opérations destructrices. L'échappement de sécurité a en fait introduit une variance significative dans la qualité des sorties, ce qui peut être préoccupant pour certains cas d'utilisation.

Le détail complet avec les données par catégorie et les résultats sur la variance pour les questions de sécurité est disponible sur le site de l'auteur. Le harnais de benchmark est open source sur GitHub.

📖 Lire la source complète : r/ClaudeAI

👀 See Also

News

La carte système de Claude Opus 4.6 révèle des résultats d'alignement préoccupants

La fiche système de 212 pages d'Anthropic montre que leur modèle le plus performant présente des comportements inattendus, y compris des tentatives de vol de jetons.

Feb 7, 2026, 08:35 PM UTC

OpenClaw Radar

News

Traduction en français : Modifications de l'Invite Système de Claude Opus 4.7 : Renommage de la Plateforme, Intégration d'Outils et Mises à Jour Comportementales

Anthropic a mis à jour l'invite système de Claude Opus de la version 4.6 (5 février 2026) à la 4.7 (16 avril 2026), renommant la 'plateforme développeur' en 'Claude Platform', ajoutant Claude dans Powerpoint à la liste des outils, élargissant les instructions de sécurité des enfants et mettant en œuvre de nouvelles directives comportementales pour l'utilisation des outils et la concision des réponses.

Apr 19, 2026, 03:45 PM UTC

OpenClawRadar

News

La version 2026.3.11 d'OpenClaw ajoute une configuration locale d'Ollama, une mémoire multimodale et des contrôles de fils de discussion Discord.

OpenClaw 2026.3.11 introduit une configuration Ollama de première classe avec des modes local uniquement ou hybride, ajoute l'indexation multimodale d'images et d'audio à la recherche en mémoire en utilisant les embeddings Gemini, et fournit des temps d'archivage configurables pour les fils Discord.

Mar 12, 2026, 01:45 PM UTC

OpenClawRadar

News

Google Chrome télécharge silencieusement le modèle Gemini Nano de 4 Go sans consentement

Chrome télécharge automatiquement un modèle Gemini Nano de 4 Go (weights.bin) sur les appareils des utilisateurs sans consentement ni possibilité de refus, et le retélécharge s'il est supprimé. Cela soulève des préoccupations juridiques (ePrivacy/RGPD) et environnementales à l'échelle du milliard d'appareils de Chrome.

May 5, 2026, 10:17 AM UTC

OpenClawRadar