SubQ: Um LLM Sub-Quadrático com Janela de Contexto de 12 Milhões de Tokens

✍️ OpenClawRadar📅 Publicado: May 6, 2026🔗 Source

SubQ da Subquadratic é um LLM pronto para produção construído sobre uma arquitetura de atenção esparsa totalmente subquadrática. Ele lida com até 12 milhões de tokens em um único prompt, executa a 150 tokens por segundo e custa aproximadamente 1/5 dos modelos líderes como GPT-5 ou Opus.

Arquitetura e Benchmarks

Diferente dos transformers padrão com atenção O(n²), o SubQ usa um mecanismo de atenção esparsa subquadrática que processa apenas relações relevantes entre tokens. Com 12M de tokens, isso reduz o custo computacional da atenção em quase 1000×. Benchmarks (validados por terceiros):

SWE-Bench Verified (codificação no mundo real): 81,8%
RULER @ 128K (precisão em contexto longo): 95,0%
MRCR v2 (8 agulhas, 1M): 65,9%

Para comparação, a pontuação do SubQ no SWE-Bench fica entre Gemini 3.1 Pro (80,6%) e Opus 4.6 (80,8%). O modelo também supera Opus 4.7 (87,6%? – não reportado na época) e GPT-5.5 (n/r) no MRCR v2.

Produtos e Integração

Duas opções de acesso:

API Full-Context: contexto de 12M de tokens, streaming, uso de ferramentas, endpoints compatíveis com OpenAI. Processe repositórios inteiros em uma única chamada com custo linear.
SubQ Code (camada de contexto longo para agentes de codificação): Integre-se ao Claude Code, Codex ou Cursor. ~25% menos na conta, exploração 10× mais rápida, redireciona automaticamente chamadas caras do modelo. Instalação com um comando.

Para Quem é

Desenvolvedores e equipes que executam agentes de IA que precisam raciocinar sobre bases de código completas, longos históricos de PR ou estado persistente sem perda de qualidade.

📖 Leia a fonte original: HN AI Agents

👀 See Also

Tools

Sumário de Alternativas ao Hermes Agent 2026: Opções Auto-hospedadas do OpenClaw ao memU Bot

Um desenvolvedor que usa o Hermes desde o lançamento testou todas as alternativas self-hosted e gerenciadas após a bagunça de segurança do ClawHub. Principais descobertas: OpenClaw (370k estrelas) mas 9 CVEs em 4 dias e ~20% de pacotes maliciosos; TrustClaw reconstruído com OAuth/sandboxing; nanobot com ~4K linhas de Python e MCP; memU Bot com memória estruturada única. Opções gerenciadas incluem Perplexity Computer (19 modelos, $200/mês), Claude Cowork (abre apps reais do Mac) e KimiClaw (40GB RAG, restrito ao K2.5, lei de dados chinesa). Resumo completo na fonte.

May 19, 2026, 02:19 AM UTC

OpenClawRadar

Tools

Causa Raiz da Corrupção do Título da Sessão da Extensão Claude Code do VS Code Identificada

Um desenvolvedor identificou a causa raiz arquitetônica para a corrupção de títulos de sessão na extensão Claude Code do VS Code, afetando mais de 20 problemas no GitHub. O problema surge da extensão ler títulos através de uma busca de string bruta em arquivos de sessão, levando a três modos de falha.

Mar 16, 2026, 11:45 PM UTC

OpenClawRadar

Tools

AgentLens: Ferramenta de Observabilidade para Fluxos de Trabalho de IA Multiagente

O AgentLens fornece rastreamento unificado em Ollama, vLLM, Anthropic e OpenAI, com monitoramento de custos, um servidor MCP para consultar estatísticas do Claude Code e uma CLI para verificações inline. É auto-hospedado e executado localmente via Docker.

Apr 16, 2026, 04:45 AM UTC

OpenClawRadar

Tools

Automatizando a Triagem de Alertas do Datadog com Claude Code e MCP

Um desenvolvedor criou um sistema usando as habilidades do Claude Code e o servidor MCP do Datadog para verificar automaticamente alertas de monitoramento, classificar problemas e abrir PRs de correção via cron job. A configuração leva cerca de 30 minutos e executa agentes de IA em paralelo em worktrees isolados.

Mar 16, 2026, 09:45 AM UTC

OpenClawRadar