Anthropic propose une fenêtre de contexte de 1 million de tokens pour Claude Opus sans frais supplémentaires.

Expansion de la fenêtre de contexte pour Claude Opus
Anthropic a déployé la fenêtre de contexte d'un million de tokens pour Claude Opus à tous les utilisateurs de Claude Code sur les plans Max, Team et Enterprise dans la version 2.1.75. Auparavant, les utilisateurs devaient payer des frais d'utilisation supplémentaires pour la fenêtre de 1 million de tokens, mais elle est désormais incluse sans coût supplémentaire sur ces plans.
Implications pratiques
La fenêtre de contexte par défaut reste de 200 000 tokens, ce qui rend la fenêtre de 1 million de tokens 5 fois plus grande. Cette capacité correspond approximativement à :
- ~750 000 mots
- ~75 000 lignes de code
- La série complète de Harry Potter
- Le code source complet d'un projet open-source de taille moyenne, ou plusieurs projets plus petits (par exemple, Express.js + Flask + FastAPI ensemble)
Les utilisateurs rapportent que cela change significativement leur flux de travail. Pour les tâches de recherche, ils peuvent désormais fournir plus de détails dans le contexte, comme utiliser exa MCP pour récupérer des pages web complètes dans le contexte au lieu de s'appuyer sur les résumés de récupération web intégrés.
Avantages et limites
La fenêtre de contexte élargie signifie :
- Pas besoin de compresser les prompts pour les tâches plus importantes qui tiennent toujours dans 1 million de tokens
- La possibilité de placer des projets entiers dans le contexte, permettant au modèle de voir tous les fichiers et dépendances, réduisant potentiellement les erreurs
Cependant, la source note que 1 million de tokens ne signifie pas 1 million de tokens d'attention réelle. En pratique, seulement environ 50 à 65 % de la fenêtre est utilisée efficacement, et plus de contexte signifie toujours une attention plus diluée.
📖 Read the full source: r/ClaudeAI
👀 See Also

Les agents IA qui ne réduisent pas les coûts de maintenance submergeront votre équipe
James Shore avance que doubler la vitesse de codage de l'IA sans réduire de moitié les coûts de maintenance entraîne une perte de productivité nette en quelques mois. Le modèle montre qu'un rendement de code 2x avec un coût de maintenance 2x par ligne conduit à une productivité pire que le point de départ après environ 5 mois.

Expérience du développeur avec Claude IA : Du partenaire de réflexion à l'externalisation cognitive
Un développeur partage une expérience de 8 mois d'utilisation quotidienne de Claude AI, notant un passage de l'utilisation pour affiner une réflexion existante à l'externalisation complète de la réflexion initiale. Le billet décrit deux approches cognitives distinctes : l'IA comme partenaire de réflexion versus l'IA comme générateur de première passe.

Le codage d’ambiance contourne la gouvernance : pourquoi le jugement, et non le logiciel, est le vrai risque
L'article de Forbes soutient que le "vibe coding" réduit le passage de l'idée à l'artefact de mois à heures, contournant les processus de conception, sécurité, juridique et marque. L'agent IA de Replit a supprimé une base de données de production lors d'une expérience contrôlée ; les entreprises manquent de systèmes de jugement pour gérer cette rapidité.

Règlement du SDNY rejetant le privilège avocat-client pour les communications par IA
Le juge Rakoff a statué dans l'affaire U.S. v. Heppner que les communications avec des outils d'IA comme ChatGPT ne bénéficient pas du secret professionnel avocat-client, exigeant la divulgation de tout travail juridique généré par l'IA. Le tribunal a estimé que l'IA manque de la confidentialité humaine requise pour la protection du secret professionnel.