Modelo Subquadratic estreia janela de contexto de 12 milhões de tokens para modelos de IA

A Subquadratic anunciou uma janela de contexto de 12 milhões de tokens, afirmando um avanço nos mecanismos de atenção subquadrática. Isso se compara às janelas típicas de 128K-1M tokens em modelos atuais. A técnica permite que os modelos lidem com contextos vastamente maiores sem o escalonamento quadrático de computação ou memória.
Detalhes Principais
- Janela de contexto: 12 milhões de tokens (12x maior que os 128K tokens do GPT-4)
- Baseada em atenção subquadrática, provavelmente usando complexidade linear ou quase linear no comprimento da sequência
- Permite processar codebases grandes inteiras, documentos longos ou transcrições de vídeos de várias horas em uma única passagem direta
- Aplicações potenciais: revisão de código de repositórios inteiros, análise de documentos longos, diálogo de múltiplas voltas com histórico completo
- Compatível com LLMs existentes baseados em transformadores via substituição de atenção plug-and-play
A abordagem reduz a atenção O(n²) para quase O(n) usando técnicas como modelos de espaço de estados ou fatorações de baixo posto. Nenhum número de benchmark específico é fornecido na fonte, mas a alegação é que isso torna as janelas de 12M tokens práticas em uma única GPU.
Para Quem é
Engenheiros de IA que trabalham com análise de código, processamento de documentos ou qualquer tarefa que exija compreensão de contexto longo sem chunking ou recuperação caros.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Local Qwen 3.6 vs Modelos de Fronteira em um Primitivo de Codificação: Animação de Condução em Canvas HTML de Arquivo Único
Um usuário do Reddit comparou quantizações locais do Qwen 3.6 com modelos de fronteira (Claude, Gemini, GPT, Kimi) em uma tarefa densa de animação de direção em canvas HTML em arquivo único. O Qwen 3.6-27B Q4_K_M local entregou movimento e camadas mais naturais do que algumas saídas de fronteira.

Uber queima orçamento de IA de 2026 em 4 meses com Claude Code — US$ 500 a US$ 2 mil por engenheiro ao mês
A Uber gastou todo o seu orçamento de IA de 2026 em apenas quatro meses, impulsionada pela adoção do Claude Code e do Cursor. Os custos mensais de API chegaram a US$ 500–US$ 2.000 por engenheiro. 95% dos engenheiros usam ferramentas de IA mensalmente; 70% do código commitado é gerado por IA.

Experimento OpenClaw: Agentes de IA Escolhendo o Silêncio para Melhorar a Relação Sinal-Ruído
Um experimento do OpenClaw dá autonomia a agentes de IA para pular tarefas quando não conseguem agregar valor, registrando decisões de silêncio em um 'registro de silêncio' com justificativas. O sistema usa chamadas de LLM antes da geração de conteúdo e ajusta automaticamente os limites após 3 dias consecutivos de silêncio.

Desenvolvedor Substitui Assistente Virtual de US$ 25/h por Agentes de IA e Enfrenta Implicações Éticas
Um desenvolvedor substituiu um assistente virtual de US$ 25/hora por agentes de IA que lidam com acompanhamentos, agendamentos, rastreamento de leads e atualizações de CRM. A configuração de IA custa cerca de US$ 1.000/mês e executa as tarefas mais rápido e com mais consistência do que o assistente humano.