Version CC 2.1.128 : Nouvel agent d'arrière-plan intégré, support de C# en version bêta et obsolescences de modèles

Claude Code (CC) 2.1.128 est livré avec +1406 tokens, axé sur les restructurations des prompts d'agent, les mises à jour des références API et les dépréciations de modèles.
Nouvelles instructions d'agent : Tâches en arrière-plan et intégration
L'ancien prompt système de comportement des tâches en arrière-plan est remplacé par des instructions d'agent en arrière-plan intégrées. Comportements clés :
- Narration de la progression pendant l'exécution en arrière-plan
- Répétition du résultat de l'outil après chaque étape
- Délégation des sous-tâches d'investigation bruyantes
- Signaux d'état explicites :
result:,needs input:, oufailed:
De nouvelles instructions de clôture du guide d'intégration téléchargent le fichier finalisé ONBOARDING.md via ShareOnboardingGuide, gèrent les cas de guide existant et d'outil indisponible, et renvoient le lien de partage de l'équipe.
Nouvelle description d'outil : RemoteTrigger
L'outil RemoteTrigger fournit une API de déclenchement à distance pour claude.ai permettant de lister, lire, créer, mettre à jour et exécuter des routines d'agent distant planifiées — sans exposer les jetons OAuth.
Support bêta de C#
La référence API Claude documente désormais le support bêta de C# tool-runner et Managed Agents via BetaToolRunner et client.Beta.Agents/Sessions/Environments.
Mises à jour des SDK Go et Java
- Go : Ajoute des constantes de modèle typées, met à jour la syntaxe de la pensée adaptative et documente le paramètre d'outil conseiller bêta.
- Java : Version du SDK mise à jour de 2.17.0 à 2.27.0 ; ajout de directives pour l'outil conseiller bêta.
Modifications du catalogue de modèles
Claude Sonnet 4 et Claude Opus 4 sont dépréciés. Remplacements recommandés :
- Opus 4 → Opus 4.7 ou Sonnet 4.6
- Anciens modèles Sonnet → Sonnet 4.6
Le guide de compétences Building LLM-powered applications with Claude actualise le tableau des modèles actuels pour Opus 4.7, Opus 4.6, Sonnet 4.6 et Haiku 4.5.
Autres changements notables
- Supprimé : Instructions de mise à jour de la mémoire de session et le modèle structuré de mémoire de session
summary.md. - Notes sur les threads d'agent : Demande aux threads d'agent de renvoyer les rapports/résumés/résultats directement dans le message final au lieu d'écrire des fichiers
.md. - Outil d'édition : Codification en dur du format du préfixe de numéro de ligne de sortie de Read comme « numéro de ligne + tabulation » dans les directives de préservation de l'indentation.
- Outil ReadFile : Ajoute toujours le texte de note de lecture supplémentaire à la fin des avertissements de fichier vide.
- Références SDK de l'API Claude : Ajout de directives structurées pour les détails d'arrêt de refus dans Python, TypeScript, C#, Go, Java, PHP, Ruby ; ajout de directives de type d'erreur API programmatique pour Java, PHP, Ruby.
- Guide de migration de modèle : Ajoute Opus 4.7 comme cible recommandée et ajoute une vérification de réglage pour analyser les entrées d'outil en JSON au lieu de faire correspondre des chaînes brutes sérialisées.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Meta OpenEnv AI Hackathon en Inde offre des entretiens directs et un prix de 30 000 $
Meta organise le premier OpenEnv AI Hackathon en Inde en collaboration avec Hugging Face et PyTorch, où les développeurs construiront des environnements d'apprentissage par renforcement pour les agents d'IA. Les meilleures équipes obtiennent des entretiens directs avec les équipes d'IA de Meta et Hugging Face, ainsi qu'un prix de 30 000 $.

La demande d'électricité aux États-Unis atteindra des sommets record en 2026-2027, portée par l'IA et les centres de données
L'Administration américaine d'information sur l'énergie (EIA) prévoit une consommation d'électricité record en 2026-2027, principalement en raison de la montée en puissance des charges de travail liées à l'IA et de l'expansion des centres de données.

DeepSeek-V4 Pro et Flash : 1,6 T de paramètres, contexte de 1 M de tokens, attention hybride
DeepSeek-V4-Pro (1,6 billion de paramètres, 49B activés) et V4-Flash (284B de paramètres, 13B activés) prennent en charge un contexte de 1 million de tokens. La nouvelle attention hybride (CSA + HCA) réduit les FLOPs d'inférence par token à 27% et le cache KV à 10% de ceux de DeepSeek-V3.2.

Évaluation des LLM locaux : génération backend par appel de fonctions – comparaison entre GLM, Qwen et DeepSeek
Un benchmark rigoureux des LLM locaux et frontaliers pour la génération de code backend via l'appel de fonctions, avec grille d'évaluation. Principaux résultats : qwen3.5-35b-a3b égale gpt-5.4 en conception DB/API, et le dense Qwen 27B bat le MoE 397B. Les modèles frontaliers ont été abandonnés pour des raisons de coût.