SubQ 1M-Preview: LLM Subquadrático com 12M Tokens e 95% no RULER

A Subquadratic lançou o SubQ 1M-Preview, o primeiro modelo de linguagem grande totalmente subquadrático, onde a computação escala linearmente com o comprimento do contexto — e não quadraticamente como nos transformers. Isso elimina a necessidade de sistemas RAG e soluções alternativas de fragmentação para tarefas de contexto longo. O modelo de pesquisa suporta até 12 milhões de tokens, com um modelo de produção de 1M de tokens disponível em acesso antecipado.

Principais Recursos

Atenção subquadrática: Reduz a computação de atenção em ~1.000x em comparação com modelos transformer de ponta em contexto de 12M de tokens, de acordo com a fonte.
SubQ Code: Agente de codificação baseado em CLI que carrega bases de código inteiras em uma única janela de contexto. Sem necessidade de orquestração multiagente — planeja, executa e revisa em um repositório completo em uma única passagem.
SubQ Search: Ferramenta de busca de contexto longo que oferece capacidades de Deep Research na velocidade de um chatbot.
API: API de contexto completo para desenvolvedores e equipes empresariais.

Benchmarks

Todos os resultados foram verificados por terceiros (a fonte não especifica a empresa):

RULER 128K: 95% de precisão — comparado a Claude Opus 4.6 com 94,8%.
MRCR v2 (recuperação e raciocínio multi-peça): Modelo de produção pontua 65,9; modelo de pesquisa pontua 83. Referência: Claude Opus 4.7 = 32,2, GPT 5.5 = 74, Gemini 3.1 Pro = 26,3.
SWE-Bench Verified: 81,8% — comparado a Opus 4.6 (80,8) e Deepseek 4.0 Pro (80,0).
Velocidade de atenção: SubQ Sparse Attention é 52× mais rápida que FlashAttention em comparação de nível de arquitetura, usando 63% menos computação.

Detalhes da Arquitetura

O modelo usa um mecanismo de atenção fundamentalmente redesenhado, construído a partir de primeiros princípios para ser subquadrático. Ele aproveita atenção linear, ideias de modelos de espaço de estado e atenção esparsa — mas, diferentemente de tentativas anteriores, mantém precisão de ponta. A equipe inclui PhDs da Meta, Google, Oxford, BYU, ByteDance, Adobe e Cambridge.

Disponibilidade

O beta privado começa hoje (5 de maio de 2026). Acesso à API, SubQ Code CLI e SubQ Search. A pontuação SWE-Bench indica forte desempenho de codificação para agentes de codificação de IA, como os leitores do OpenClawRadar.

📖 Leia a fonte original: HN AI Agents

SubQ: Primeiro LLM Totalmente Subquadrático com Contexto de 12M Tokens e 95% de Precisão no RULER

Principais Recursos

Benchmarks

Detalhes da Arquitetura

Disponibilidade

👀 See Also

Claude Code v2.1.158: Modo Auto Agora no Bedrock, Vertex, Foundry para Opus 4.7/4.8

Spotify Lança Selos 'Verificados' para Identificar Artistas Humanos vs. Geração por IA

O modelo furtivo Healer Alpha da OpenRouter parece ser uma variante não lançada do Qwen 3.5-Omni.

Problemas de Confiabilidade do Gateway OpenClaw: Falhas Silenciosas Após 25 Dias de Uso Intenso