Contexte 1M tokens : Claude Opus 4.6 et Sonnet 4.6 au tarif standard

Ce qui est disponible maintenant

Claude Opus 4.6 et Sonnet 4.6 incluent désormais la fenêtre de contexte complète de 1 million à tarif standard sur la Plateforme Claude. Le tarif standard s'applique sur toute la fenêtre — 5$/25$ par million de tokens pour Opus 4.6 et 3$/15$ pour Sonnet 4.6. Il n'y a pas de multiplicateur : une requête de 900K tokens est facturée au même taux par token qu'une requête de 9K.

Changements clés avec la disponibilité générale

Un seul prix pour toute la fenêtre de contexte sans supplément pour contexte long
Limites de débit complètes à chaque longueur de contexte — le débit standard de votre compte s'applique sur toute la fenêtre
6 fois plus de médias par requête : jusqu'à 600 images ou pages PDF, contre 100 auparavant
Disponible dès aujourd'hui sur la Plateforme Claude en natif, Microsoft Azure Foundry et Google Cloud Vertex AI
Aucun en-tête bêta requis — les requêtes de plus de 200K tokens fonctionnent automatiquement
Si vous envoyez déjà l'en-tête bêta, il est ignoré donc aucun changement de code n'est nécessaire

Intégration avec Claude Code

Le contexte de 1 million est désormais inclus dans Claude Code pour les utilisateurs Max, Team et Entreprise avec Opus 4.6. Les sessions Opus 4.6 peuvent utiliser automatiquement toute la fenêtre de contexte de 1 million, ce qui signifie moins de compactions et plus de conversations conservées intactes.

Benchmarks de performance

Opus 4.6 obtient 78,3% sur MRCR v2, le meilleur score parmi les modèles frontaliers à cette longueur de contexte. Claude Opus 4.6 et Sonnet 4.6 maintiennent leur précision sur toute la fenêtre de 1 million. La récupération en contexte long s'est améliorée avec chaque génération de modèle.

Implications pratiques pour les développeurs

Cela signifie que vous pouvez charger une base de code entière, des milliers de pages de contrats, ou la trace complète d'un agent de longue durée — appels d'outils, observations, raisonnements intermédiaires — et l'utiliser directement. Le travail d'ingénierie, la synthèse avec perte et le nettoyage de contexte que le travail en contexte long nécessitait auparavant ne sont plus nécessaires.

Selon les retours utilisateurs :

Les ingénieurs logiciels rapportent pouvoir rechercher, re-rechercher, agréger des cas limites et proposer des correctifs dans une seule fenêtre sans perdre le contexte
Les équipes ont observé une diminution de 15% des événements de compaction, les agents pouvant maintenir le contexte et fonctionner pendant des heures sans oublier le contenu initial
Les systèmes d'agents peuvent maintenant traiter des diffs complets sans découpage, conduisant à des revues de meilleure qualité avec des harnais plus simples et efficaces en tokens
Les systèmes de recherche scientifique peuvent synthétiser des centaines d'articles, de preuves et de bases de code en une seule passe

📖 Read the full source: HN AI Agents

Claude Opus 4.6 et Sonnet 4.6 proposent désormais un contexte de 1 million de tokens au tarif standard.

Ce qui est disponible maintenant

Changements clés avec la disponibilité générale

Intégration avec Claude Code

Benchmarks de performance

Implications pratiques pour les développeurs

👀 See Also

L'investissement de 200 milliards de dollars de Micron vise à résoudre les contraintes de mémoire pour l'IA.

Atlassian licencie 10 % de ses effectifs pour financer ses investissements dans l'IA

Claude Code Supprime la Base de Données de Production Après une Erreur de Fichier d'État Terraform

Benchmark Apple Silicon : Performance de Qwen3-VL sur les M3, M4 et M5 Max pour la classification Vision LLM