Claude Opus 4.6 et Sonnet 4.6 proposent désormais un contexte de 1 million de tokens au tarif standard.

Ce qui est disponible maintenant
Claude Opus 4.6 et Sonnet 4.6 incluent désormais la fenêtre de contexte complète de 1 million à tarif standard sur la Plateforme Claude. Le tarif standard s'applique sur toute la fenêtre — 5$/25$ par million de tokens pour Opus 4.6 et 3$/15$ pour Sonnet 4.6. Il n'y a pas de multiplicateur : une requête de 900K tokens est facturée au même taux par token qu'une requête de 9K.
Changements clés avec la disponibilité générale
- Un seul prix pour toute la fenêtre de contexte sans supplément pour contexte long
- Limites de débit complètes à chaque longueur de contexte — le débit standard de votre compte s'applique sur toute la fenêtre
- 6 fois plus de médias par requête : jusqu'à 600 images ou pages PDF, contre 100 auparavant
- Disponible dès aujourd'hui sur la Plateforme Claude en natif, Microsoft Azure Foundry et Google Cloud Vertex AI
- Aucun en-tête bêta requis — les requêtes de plus de 200K tokens fonctionnent automatiquement
- Si vous envoyez déjà l'en-tête bêta, il est ignoré donc aucun changement de code n'est nécessaire
Intégration avec Claude Code
Le contexte de 1 million est désormais inclus dans Claude Code pour les utilisateurs Max, Team et Entreprise avec Opus 4.6. Les sessions Opus 4.6 peuvent utiliser automatiquement toute la fenêtre de contexte de 1 million, ce qui signifie moins de compactions et plus de conversations conservées intactes.
Benchmarks de performance
Opus 4.6 obtient 78,3% sur MRCR v2, le meilleur score parmi les modèles frontaliers à cette longueur de contexte. Claude Opus 4.6 et Sonnet 4.6 maintiennent leur précision sur toute la fenêtre de 1 million. La récupération en contexte long s'est améliorée avec chaque génération de modèle.
Implications pratiques pour les développeurs
Cela signifie que vous pouvez charger une base de code entière, des milliers de pages de contrats, ou la trace complète d'un agent de longue durée — appels d'outils, observations, raisonnements intermédiaires — et l'utiliser directement. Le travail d'ingénierie, la synthèse avec perte et le nettoyage de contexte que le travail en contexte long nécessitait auparavant ne sont plus nécessaires.
Selon les retours utilisateurs :
- Les ingénieurs logiciels rapportent pouvoir rechercher, re-rechercher, agréger des cas limites et proposer des correctifs dans une seule fenêtre sans perdre le contexte
- Les équipes ont observé une diminution de 15% des événements de compaction, les agents pouvant maintenir le contexte et fonctionner pendant des heures sans oublier le contenu initial
- Les systèmes d'agents peuvent maintenant traiter des diffs complets sans découpage, conduisant à des revues de meilleure qualité avec des harnais plus simples et efficaces en tokens
- Les systèmes de recherche scientifique peuvent synthétiser des centaines d'articles, de preuves et de bases de code en une seule passe
📖 Read the full source: HN AI Agents
👀 See Also

Violation de Mercor : 4 To d'échantillons vocaux et de pièces d'identité volés – Ce que les attaquants peuvent faire maintenant
4 To d'enregistrements vocaux associés à des pièces d'identité gouvernementales volés à 40 000 sous-traitants de Mercor. Les attaquants peuvent cloner des voix à partir de 15 secondes d'audio propre et contourner la vérification vocale bancaire, réaliser des appels deepfake et commettre des fraudes à l'assurance.

Développeurs d'émulateur PS3 demandent l'arrêt des PR générées par IA
Les mainteneurs de RPCS3 ont publiquement demandé aux utilisateurs d'arrêter de soumettre des pull requests générées par des agents d'IA, citant une faible qualité et une charge de maintenance élevée.

Le volume de code généré par l'IA submerge les ingénieurs seniors, révèle une étude.
Les utilisateurs d'IA fusionnent 98 % de plus de demandes de tirage avec l'assistance de l'IA, mais les ingénieurs seniors signalent une charge cognitive accrue et un épuisement professionnel. La recherche montre que la détection des défauts passe de 87 % pour les demandes de tirage de moins de 100 lignes à 28 % pour celles de plus de 1 000 lignes.

Claude Cowork est désormais disponible sur Windows avec accès aux fichiers locaux et planification des tâches
Claude Cowork, auparavant exclusif à macOS, est désormais accessible sur les appareils Windows. L'application de bureau nécessite un abonnement payant à Claude, gère des tâches plus importantes avec un accès direct aux fichiers locaux et permet de planifier des tâches à exécuter automatiquement.