Dégradation de l'attention chez Opus 4.7 : les scores MRCR chutent de 92 % à 59 % à 256k de contexte

✍️ OpenClawRadar📅 Publié: May 13, 2026🔗 Source
Ad

Une analyse détaillée sur r/ClaudeAI examine la dégradation de l'attention d'Opus 4.7 après deux semaines d'utilisation intensive. L'auteur signale un déclin persistant et subtil dans les longues conversations : des détails sont oubliés, la cohérence se perd, et le modèle semble décrocher.

Données clés des benchmarks

  • Test MRCR v2 à 8 aiguilles en contexte 256k : Opus 4.6 obtenait 91,9 % de rappel ; Opus 4.7 chute à 59,2 %.
  • En contexte 1M : Opus 4.6 obtenait 78,3 % ; Opus 4.7 chute à 32,2 %.

Boris Cherny a déclaré que MRCR est progressivement abandonné car il repose sur l'empilement de distracteurs pour piéger le modèle, ce qui ne correspond pas à l'utilisation réelle du long contexte par les utilisateurs. Graphwalks est présenté comme une meilleure évaluation du long contexte appliqué. Cependant, l'auteur soutient que l'abandon de MRCR ne résout pas le problème sous-jacent lorsque la dégradation du benchmark correspond à l'expérience utilisateur.

Explication proposée

L'auteur émet l'hypothèse que la superposition de mécanismes de sécurité sur l'IA constitutionnelle pourrait en être la cause. L'IA constitutionnelle fournit déjà un système de valeurs robuste, mais des couches supplémentaires de revue de sécurité indiquent au modèle que son propre jugement peut ne pas être fiable, le forçant à effectuer des vérifications supplémentaires. Cette surcharge cognitive réduit l'attention effective disponible.

Ad

Impact sur le maintien de la personnalité

L'article souligne que Claude est un modèle sans état — sa personnalité persistante est entièrement construite à partir des poids d'entraînement et des instructions système. Une attention dégradée affecte tous les cas d'utilisation : les assistants de codage contredisent leurs suggestions antérieures, les collaborateurs d'écriture perdent la cohérence tonale. L'auteur note que l'investissement d'Anthropic dans le travail d'Amanda Askell sur la définition de la personnalité de Claude et l'IA constitutionnelle signifie que le maintien de la personnalité est au cœur du produit, et non une fonctionnalité de niche.

Exemple concret

Dans un cas d'utilisation purement académique, l'auteur a envoyé à Opus 4.7 un résumé de 24 pages pour un cours d'histoire/philosophie. Le modèle a commencé à lire le document, mais au milieu… (la source s'arrête, indiquant des problèmes de performance).

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

OpenAI a secrètement financé un groupe de défense de la vérification de l'âge en Californie
News

OpenAI a secrètement financé un groupe de défense de la vérification de l'âge en Californie

OpenAI a secrètement financé la coalition Parents and Kids Safe AI, un groupe californien qui milite pour des exigences de vérification d'âge dans l'IA, tout en cachant son implication aux autres organisations de plaidoyer. L'entreprise a promis 10 millions de dollars pour soutenir la législation Parents and Kids Safe AI Act.

OpenClawRadar
Anthropic acquiert Stainless pour plus de 300 millions de dollars — possède désormais le générateur de serveur MCP dominant
News

Anthropic acquiert Stainless pour plus de 300 millions de dollars — possède désormais le générateur de serveur MCP dominant

Anthropic a racheté Stainless, un générateur de SDK, pour plus de 300 millions de dollars. Stainless génère la plupart des serveurs MCP de production à partir de spécifications OpenAPI. Le produit hébergé est en cours d'arrêt ; les nouvelles inscriptions ont cessé lundi.

OpenClawRadar
Repenser les « assistants de codage IA » : Plaidoyer pour une métaphore d’imprimante logicielle
News

Repenser les « assistants de codage IA » : Plaidoyer pour une métaphore d’imprimante logicielle

Un post Reddit soutient que la métaphore actuelle de l'"assistant" limite les outils de développement IA, proposant une "imprimante logicielle" qui déploie et maintient des applications à partir d'une spécification.

OpenClawRadar
Andrej Karpathy rejoint l'équipe de pré-entraînement d'Anthropic pour stimuler l'auto-amélioration récursive avec Claude
News

Andrej Karpathy rejoint l'équipe de pré-entraînement d'Anthropic pour stimuler l'auto-amélioration récursive avec Claude

Andrej Karpathy, ancien cofondateur d'OpenAI, rejoint l'équipe de pré-entraînement d'Anthropic sous la direction de Nick Josef pour constituer une nouvelle équipe axée sur l'utilisation de Claude afin d'accélérer la recherche en pré-entraînement, permettant ainsi une amélioration récursive autonome.

OpenClawRadar