Subquadratic lance une fenêtre de contexte de 12 millions de tokens pour les modèles d'IA

Subquadratic a annoncé une fenêtre de contexte de 12 millions de tokens, revendiquant une percée dans les mécanismes d'attention subquadratiques. Cela se compare aux fenêtres typiques de 128K à 1M de tokens dans les modèles actuels. La technique permet aux modèles de traiter des contextes beaucoup plus volumineux sans mise à l'échelle quadratique du calcul ou de la mémoire.
Détails clés
- Fenêtre de contexte : 12 millions de tokens (12 fois plus grande que les 128K tokens de GPT-4)
- Basé sur une attention subquadratique, utilisant probablement une complexité linéaire ou quasi-linéaire en fonction de la longueur de la séquence
- Permet de traiter des codebases entières, de longs documents ou des transcriptions vidéo de plusieurs heures en un seul passage avant
- Applications potentielles : revue de code de dépôts entiers, analyse de documents longs, dialogues multi-tours avec historique complet
- Compatible avec les LLM existants basés sur les transformeurs via un remplacement d'attention plug-and-play
L'approche réduit l'attention O(n²) à quasi-O(n) grâce à des techniques comme les modèles d'espace d'état ou les factorisations de bas rang. Aucun chiffre de référence spécifique n'est fourni dans la source, mais l'affirmation est que cela rend les fenêtres de 12M de tokens pratiques sur un seul GPU.
À qui cela s'adresse
Ingénieurs IA travaillant sur l'analyse de code, le traitement de documents ou toute tâche nécessitant une compréhension en long contexte sans découpage coûteux ou recherche d'information.
📖 Read the full source: HN AI Agents
👀 See Also

Notes de version de Claude Desktop 1.1.4498 : Rebond du Dock, Extension de l'environnement Shell et Prise en charge du Cloud Gouvernemental
Claude Desktop 1.1.4498 ajoute des notifications de rebond dans le dock pour attirer l'attention de l'utilisateur, étend l'extraction de l'environnement shell pour inclure des variables spécifiques à Claude, et introduit la détection des déploiements gouvernementaux/personnalisés. La mise à jour réduit également le délai d'expiration des appels d'outils du pont Chrome de 120 à 10 secondes.

Analyse du 'Clausage' : Modèles d'Anxiété des Utilisateurs dans les Abonnements à l'IA
Une analyse utilisateur identifie le 'Clausage' ou 'Le Syndrome Claude' – des schémas comportementaux où les abonnés premium à l'IA éprouvent une anxiété chronique d'utilisation, un comportement d'évitement et une surveillance compulsive des ressources. La source détaille des symptômes spécifiques comme l'évitement anticipatoire, l'hypervigilance d'utilisation et la sous-utilisation paradoxale des services payants.

Les conditions du contrat du Pentagone avec OpenAI autorisent 'toute utilisation légale', y compris une éventuelle surveillance
OpenAI a négocié de nouvelles conditions avec le Pentagone qui incluent l'expression 'toute utilisation légale', ce qui, selon des sources, permettrait à l'armée d'utiliser la technologie d'OpenAI pour des programmes de surveillance de masse si ceux-ci sont techniquement légaux. Anthropic a été mis sur liste noire pour avoir refusé de céder sur deux lignes rouges : pas de surveillance de masse des Américains et pas d'armes autonomes létales.

Claude.ai connaît des erreurs accrues et des problèmes de connexion
Claude.ai signale des erreurs élevées affectant la plateforme, y compris des problèmes de connexion spécifiquement pour Claude Code. L'incident a été officiellement publié le 11 mars 2026 à 17:19:35 UTC.