SubQ: Primer modelo de lenguaje completamente subcuadrático con contexto de 12 millones de tokens y 95% de precisión en RULER

Subquadratic ha lanzado SubQ 1M-Preview, el primer modelo de lenguaje grande completamente subcuadrático, donde el cómputo escala linealmente con la longitud del contexto, no de forma cuadrática como en los transformers. Esto elimina la necesidad de sistemas RAG y soluciones de fragmentación para tareas de contexto largo. El modelo de investigación admite hasta 12 millones de tokens, con un modelo de producción de 1 millón de tokens disponible en acceso temprano.
Características principales
- Atención subcuadrática: Reduce el cómputo de atención en aproximadamente 1.000× en comparación con los modelos transformer de frontera en un contexto de 12 millones de tokens, según la fuente.
- SubQ Code: Agente de codificación basado en CLI que carga bases de código completas en una sola ventana de contexto. Sin necesidad de orquestación multiagente: planifica, ejecuta y revisa en un repositorio completo en una sola pasada.
- SubQ Search: Herramienta de búsqueda de contexto largo que ofrece capacidades de Deep Research a la velocidad de un chatbot.
- API: API de contexto completo para desarrolladores y equipos empresariales.
Benchmarks
Todos los resultados fueron verificados por un tercero (la fuente no especifica la empresa):
- RULER 128K: 95% de precisión, en comparación con Claude Opus 4.6 con 94.8%.
- MRCR v2 (recuperación y razonamiento de múltiples piezas): El modelo de producción obtiene 65.9; el modelo de investigación obtiene 83. Referencia: Claude Opus 4.7 = 32.2, GPT 5.5 = 74, Gemini 3.1 Pro = 26.3.
- SWE-Bench Verified: 81.8%, en comparación con Opus 4.6 (80.8) y Deepseek 4.0 Pro (80.0).
- Velocidad de atención: SubQ Sparse Attention es 52× más rápida que FlashAttention en una comparación a nivel de arquitectura, usando un 63% menos de cómputo.
Detalles de la arquitectura
El modelo utiliza un mecanismo de atención fundamentalmente rediseñado, construido desde primeros principios para ser subcuadrático. Aprovecha la atención lineal, ideas de modelos de espacio de estados y atención dispersa, pero a diferencia de intentos anteriores, mantiene una precisión de nivel frontera. El equipo incluye doctores de Meta, Google, Oxford, BYU, ByteDance, Adobe y Cambridge.
Disponibilidad
La beta privada comienza hoy (5 de mayo de 2026). Acceso a API, SubQ Code CLI y SubQ Search. La puntuación SWE-Bench indica un rendimiento de codificación sólido para agentes de codificación de IA como los lectores de OpenClawRadar.
📖 Leer la fuente completa: HN AI Agents
👀 Ver también

Acuerdo de cómputo Anthropic-xAI: Más allá de los límites de Claude Code
Anthropic firmó un acuerdo de 300MW / 220k GPU con su competidor xAI. Esto indica una oferta de GPU más ajustada y un intercambio estructural de cómputo entre laboratorios, con implicaciones para los precios de inferencia y el enrutamiento multimodal.

Eligiendo el Mejor Proveedor de Tokens para las Necesidades de Tu API
Explora los factores clave a considerar al seleccionar un proveedor de tokens y APIs en la codificación y automatización de IA, basado en las ideas de la comunidad de OpenClaw.

Dos funcionarios sudafricanos de Asuntos de Interior suspendidos por alucinaciones de IA en un documento de política
Dos funcionarios fueron suspendidos después de que se encontraran alucinaciones de IA en la lista de referencias de un libro blanque revisado sobre ciudadanía, inmigración y protección de refugiados. El departamento implementará controles de IA y revisará todos los documentos políticos desde noviembre de 2022.

Informe de Stanford Muestra que Expertos en IA y el Público Tienen Opiniones Divergentes sobre el Impacto de la IA
El informe anual de la industria de IA de Stanford revela brechas significativas entre el optimismo de los expertos en IA y la ansiedad del público, con los expertos enfocados en los riesgos de la AGI mientras el público se preocupa por los empleos, la atención médica y los costos de servicios públicos.