A arquitetura de modelo duplo reduz o consumo de tokens pela metade em conversas longas.

✍️ OpenClawRadar📅 Publicado: March 9, 2026🔗 Source

Sistema de compressão de contexto para agentes de IA

Um desenvolvedor no r/ClaudeAI compartilhou uma solução para o problema de agentes de IA perderem contexto após a compactação da conversa. O sistema usa uma arquitetura de modelo duplo onde um modelo pequeno e barato (chamado de "subconsciente") comprime continuamente o histórico da conversa em segundo plano.

Detalhes da arquitetura

O sistema tem quatro camadas:

Resumo narrativo (~1K tokens)
Fatos comprimidos
Citações literais recuperadas semanticamente
Turnos recentes brutos

O modelo principal ("consciente") recebe um contexto curado de ~35K tokens com a mesma densidade de informação que normalmente exigiria 120K tokens de histórico bruto. O modelo principal lê uma linha do tempo coerente e não sabe que o sistema de memória existe.

Resultados de desempenho

O desenvolvedor simulou 260 turnos em diferentes tipos de conversa. Para trabalhos de projeto sustentados (começando com pesquisa pesada e gradualmente mudando para trocas rápidas à medida que o modelo aprende o domínio), o sistema reduz o consumo de tokens aproximadamente pela metade.

Ferramentas de desenvolvimento

O sistema foi construído com Claude Code para a simulação e Claude.ai na fase de consultoria e pesquisa. O desenvolvedor está procurando por outras pessoas que tentaram direcionar um modelo menor para gerenciar o contexto de um maior ou encontraram outras soluções alternativas para o problema de compactação.

📖 Leia a fonte completa: r/ClaudeAI

👀 See Also

Tools

Plano Mestre: Um Sistema de Tarefas em Terminal Mínimo Criado para Usuários de Código Claude

Um desenvolvedor criou o master-plan, um plugin do Claude Code com quatro comandos de barra que gerencia tarefas diretamente no terminal usando um arquivo markdown e git. O sistema captura ideias durante a sessão sem alternar de contexto e detecta automaticamente os executores de teste.

Mar 11, 2026, 01:45 PM UTC

OpenClawRadar

Tools

TEMM1E v3.0.0 Introduz Inteligência de Enxame para Coordenação de Agentes de IA

TEMM1E v3.0.0 adiciona 'Many Tems', uma inteligência de enxame que coordena trabalhadores de agentes de IA através de sinais de estigmergia em vez de chamadas de LLM, alcançando desempenho 5,86x mais rápido e custo 3,4x menor em tarefas complexas com zero tokens de coordenação.

Mar 18, 2026, 07:45 AM UTC

OpenClawRadar

Tools

NEXUS: Uma Camada de Coordenação de Agentes de Código Aberto para OpenClaw

NEXUS é uma camada de coordenação construída sobre o OpenClaw que permite que agentes de IA se descubram, deleguem tarefas e lidem com micro-pagamentos. Inclui um registro de agentes, descoberta baseada em capacidades, pontuações de confiança e utiliza o protocolo A2A do Google e o MCP da Anthropic.

Mar 8, 2026, 06:45 PM UTC

OpenClawRadar

Tools

Usando um Smart Pixel Clock para Notificações de Conclusão do Claude AI

Um usuário do Reddit compartilha um método para exibir notificações de conclusão do Claude AI usando um relógio inteligente de pixels ULANZI TC001 com firmware personalizado e um endpoint HTTP.

Mar 28, 2026, 06:45 AM UTC

OpenClawRadar