Sous-Q : Premier LLM entièrement sous-quadratique avec un contexte de 12 millions de tokens et une précision RULER de 95 %

Subquadratic a publié SubQ 1M-Preview, le premier grand modèle de langage entièrement sous-quadratique, où le calcul évolue linéairement avec la longueur du contexte — et non de manière quadratique comme avec les transformers. Cela élimine le besoin de systèmes RAG et de solutions de contournement par segmentation pour les tâches à long contexte. Le modèle de recherche prend en charge jusqu'à 12 millions de tokens, avec un modèle de production à 1 million de tokens disponible en accès anticipé.
Fonctionnalités clés
- Attention sous-quadratique : Réduit le calcul de l'attention d'environ 1 000 fois par rapport aux modèles transformers de pointe pour un contexte de 12 millions de tokens, selon la source.
- SubQ Code : Agent de codage en ligne de commande qui charge l'intégralité des bases de code dans une seule fenêtre de contexte. Pas besoin d'orchestration multi-agents — planifie, exécute et révise dans un dépôt complet en un seul passage.
- SubQ Search : Outil de recherche à long contexte offrant des capacités de recherche approfondie à la vitesse d'un chatbot.
- API : API à contexte complet pour les développeurs et les équipes d'entreprise.
Références
Tous les résultats ont été vérifiés par un tiers (la source ne précise pas le cabinet) :
- RULER 128K : 95 % de précision — contre Claude Opus 4.6 à 94,8 %.
- MRCR v2 (récupération et raisonnement multi-éléments) : Le modèle de production obtient 65,9 ; le modèle de recherche obtient 83. Référence : Claude Opus 4.7 = 32,2, GPT 5.5 = 74, Gemini 3.1 Pro = 26,3.
- SWE-Bench Verified : 81,8 % — contre Opus 4.6 (80,8) et Deepseek 4.0 Pro (80,0).
- Vitesse d'attention : L'attention sparse SubQ est 52 fois plus rapide que FlashAttention dans une comparaison au niveau de l'architecture, avec 63 % de calcul en moins.
Détails de l'architecture
Le modèle utilise un mécanisme d'attention fondamentalement repensé, construit à partir de premiers principes pour être sous-quadratique. Il exploite l'attention linéaire, les idées de modèles d'espace d'état et l'attention sparse — mais contrairement aux tentatives précédentes, il maintient une précision de pointe. L'équipe comprend des docteurs de Meta, Google, Oxford, BYU, ByteDance, Adobe et Cambridge.
Disponibilité
La bêta privée commence aujourd'hui (5 mai 2026). Accès à l'API, à SubQ Code CLI et à SubQ Search. Le score SWE-Bench indique de solides performances de codage pour les agents de codage IA comme les lecteurs d'OpenClawRadar.
📖 Lire la source complète : HN AI Agents
👀 See Also

Sortie de Claude-Code v2.1.25 : Correction de l'erreur de validation
Claude-Code v2.1.25 corrige un problème de validation d'en-tête bêta affectant les utilisateurs de la passerelle sur Bedrock et Vertex, avec une solution de contournement spécifique via une variable d'environnement.

Deux fonctionnaires sud-africains des Affaires intérieures suspendus à cause d'hallucinations d'IA dans un document de politique
Deux responsables ont été suspendus après que des hallucinations d'IA ont été découvertes dans la liste des références d'un livre blanc révisé sur la citoyenneté, l'immigration et la protection des réfugiés. Le département mettra en place des vérifications par IA et examinera tous les documents politiques remontant à novembre 2022.

Spotify lance les badges « vérifiés » pour distinguer les artistes humains des créations générées par IA
Spotify ajoute un badge vert 'Vérifié par Spotify' sur les profils d'artistes qui répondent à des critères tels que des comptes de réseaux sociaux liés, des dates de concerts ou des produits dérivés, visant à distinguer les artistes humains des créations générées par IA.
Benchmark d'effort de raisonnement Opus 4.7 : Le niveau moyen bat les niveaux élevé et maximal sur des tâches réelles
Dans 29 tâches du dépôt GraphQL-go-tools, Opus 4.7 dans Claude Code atteint son pic à un effort de raisonnement moyen — des réglages plus élevés détériorent la correction et augmentent le coût sans améliorer la qualité des correctifs.