SubQ: Primeiro LLM Totalmente Subquadrático com Contexto de 12M Tokens e 95% de Precisão no RULER

A Subquadratic lançou o SubQ 1M-Preview, o primeiro modelo de linguagem grande totalmente subquadrático, onde a computação escala linearmente com o comprimento do contexto — e não quadraticamente como nos transformers. Isso elimina a necessidade de sistemas RAG e soluções alternativas de fragmentação para tarefas de contexto longo. O modelo de pesquisa suporta até 12 milhões de tokens, com um modelo de produção de 1M de tokens disponível em acesso antecipado.
Principais Recursos
- Atenção subquadrática: Reduz a computação de atenção em ~1.000x em comparação com modelos transformer de ponta em contexto de 12M de tokens, de acordo com a fonte.
- SubQ Code: Agente de codificação baseado em CLI que carrega bases de código inteiras em uma única janela de contexto. Sem necessidade de orquestração multiagente — planeja, executa e revisa em um repositório completo em uma única passagem.
- SubQ Search: Ferramenta de busca de contexto longo que oferece capacidades de Deep Research na velocidade de um chatbot.
- API: API de contexto completo para desenvolvedores e equipes empresariais.
Benchmarks
Todos os resultados foram verificados por terceiros (a fonte não especifica a empresa):
- RULER 128K: 95% de precisão — comparado a Claude Opus 4.6 com 94,8%.
- MRCR v2 (recuperação e raciocínio multi-peça): Modelo de produção pontua 65,9; modelo de pesquisa pontua 83. Referência: Claude Opus 4.7 = 32,2, GPT 5.5 = 74, Gemini 3.1 Pro = 26,3.
- SWE-Bench Verified: 81,8% — comparado a Opus 4.6 (80,8) e Deepseek 4.0 Pro (80,0).
- Velocidade de atenção: SubQ Sparse Attention é 52× mais rápida que FlashAttention em comparação de nível de arquitetura, usando 63% menos computação.
Detalhes da Arquitetura
O modelo usa um mecanismo de atenção fundamentalmente redesenhado, construído a partir de primeiros princípios para ser subquadrático. Ele aproveita atenção linear, ideias de modelos de espaço de estado e atenção esparsa — mas, diferentemente de tentativas anteriores, mantém precisão de ponta. A equipe inclui PhDs da Meta, Google, Oxford, BYU, ByteDance, Adobe e Cambridge.
Disponibilidade
O beta privado começa hoje (5 de maio de 2026). Acesso à API, SubQ Code CLI e SubQ Search. A pontuação SWE-Bench indica forte desempenho de codificação para agentes de codificação de IA, como os leitores do OpenClawRadar.
📖 Leia a fonte original: HN AI Agents
👀 See Also

Claude Code adiciona entrada de voz com funcionalidade de pressionar para falar
O Claude Code está lançando o modo de voz para aproximadamente 5% dos usuários inicialmente, com ativação push-to-talk ao segurar a barra de espaço. Os tokens de transcrição de voz não contam contra os limites de taxa e o recurso está incluído sem custo adicional.

Claude-Code v2.1.74 Lançamento: Correções de Vazamento de Memória, Otimização de Contexto e Melhorias em Plugins
Claude-Code v2.1.74 corrige um vazamento crítico de memória nas respostas da API de streaming que causava crescimento ilimitado de RSS nos caminhos de código Node.js/npm. A atualização adiciona sugestões acionáveis ao comando /context e introduz a configuração autoMemoryDirectory para armazenamento personalizado de memória automática.

Habilidades do Claude Não Têm Modelo de Negócio para Criadores — O Dilema de um Desenvolvedor
Um post no Reddit destaca que criadores de skills do Claude não conseguem monetizar seu trabalho, já que a Anthropic lançou um excelente runtime, mas parou antes de implementar uma camada de economia de criadores. Os desenvolvedores ficam com projetos open source e nenhum caminho para a sustentabilidade.

Cartão de Modelo do Claude Opus 4.7 Lançado
A Anthropic publicou a ficha técnica do modelo Claude Opus 4.7, fornecendo documentação técnica para seu mais recente modelo de IA. O material de origem parece ser um documento PDF contendo especificações do sistema e detalhes técnicos.