SubQ: Modelo subcuadrático con contexto de 12M tokens y 95% precisión

Subquadratic ha lanzado SubQ 1M-Preview, el primer modelo de lenguaje grande completamente subcuadrático, donde el cómputo escala linealmente con la longitud del contexto, no de forma cuadrática como en los transformers. Esto elimina la necesidad de sistemas RAG y soluciones de fragmentación para tareas de contexto largo. El modelo de investigación admite hasta 12 millones de tokens, con un modelo de producción de 1 millón de tokens disponible en acceso temprano.

Características principales

Atención subcuadrática: Reduce el cómputo de atención en aproximadamente 1.000× en comparación con los modelos transformer de frontera en un contexto de 12 millones de tokens, según la fuente.
SubQ Code: Agente de codificación basado en CLI que carga bases de código completas en una sola ventana de contexto. Sin necesidad de orquestación multiagente: planifica, ejecuta y revisa en un repositorio completo en una sola pasada.
SubQ Search: Herramienta de búsqueda de contexto largo que ofrece capacidades de Deep Research a la velocidad de un chatbot.
API: API de contexto completo para desarrolladores y equipos empresariales.

Benchmarks

Todos los resultados fueron verificados por un tercero (la fuente no especifica la empresa):

RULER 128K: 95% de precisión, en comparación con Claude Opus 4.6 con 94.8%.
MRCR v2 (recuperación y razonamiento de múltiples piezas): El modelo de producción obtiene 65.9; el modelo de investigación obtiene 83. Referencia: Claude Opus 4.7 = 32.2, GPT 5.5 = 74, Gemini 3.1 Pro = 26.3.
SWE-Bench Verified: 81.8%, en comparación con Opus 4.6 (80.8) y Deepseek 4.0 Pro (80.0).
Velocidad de atención: SubQ Sparse Attention es 52× más rápida que FlashAttention en una comparación a nivel de arquitectura, usando un 63% menos de cómputo.

Detalles de la arquitectura

El modelo utiliza un mecanismo de atención fundamentalmente rediseñado, construido desde primeros principios para ser subcuadrático. Aprovecha la atención lineal, ideas de modelos de espacio de estados y atención dispersa, pero a diferencia de intentos anteriores, mantiene una precisión de nivel frontera. El equipo incluye doctores de Meta, Google, Oxford, BYU, ByteDance, Adobe y Cambridge.

Disponibilidad

La beta privada comienza hoy (5 de mayo de 2026). Acceso a API, SubQ Code CLI y SubQ Search. La puntuación SWE-Bench indica un rendimiento de codificación sólido para agentes de codificación de IA como los lectores de OpenClawRadar.

📖 Leer la fuente completa: HN AI Agents

SubQ: Primer modelo de lenguaje completamente subcuadrático con contexto de 12 millones de tokens y 95% de precisión en RULER

Características principales

Benchmarks

Detalles de la arquitectura

Disponibilidad

👀 Ver también

Acuerdo de cómputo Anthropic-xAI: Más allá de los límites de Claude Code

Eligiendo el Mejor Proveedor de Tokens para las Necesidades de Tu API

Dos funcionarios sudafricanos de Asuntos de Interior suspendidos por alucinaciones de IA en un documento de política

Informe de Stanford Muestra que Expertos en IA y el Público Tienen Opiniones Divergentes sobre el Impacto de la IA