CAL: Camada de Otimização de Contexto de Código Aberto para Agentes de LLM

✍️ OpenClawRadar📅 Publicado: April 15, 2026🔗 Source
CAL: Camada de Otimização de Contexto de Código Aberto para Agentes de LLM
Ad

O que o CAL faz

CAL é uma biblioteca Python que fica entre seu código existente e as chamadas de API de LLM, selecionando, comprimindo e montando o contexto de forma inteligente para cada solicitação. Ele aborda os problemas de custo e contexto em configurações de agentes com muitos tokens, particularmente relevante com as recentes mudanças nas assinaturas Claude Pro/Max.

Benchmarks de Desempenho

Em produção com Claude Opus 4 e 103 blocos de contexto:

  • Sem CAL: Cada solicitação envia todos os 103 blocos (~23.000 tokens) a US$ 0,043 por solicitação
  • Com CAL: Reduz para ~6 blocos e 4.100 tokens a US$ 0,008 por solicitação
  • Resultados: Redução de 83% nos tokens, redução de 81% no custo

Validado com 5.000 prompts do WildChat (um conjunto de dados acadêmico aberto de conversas reais de LLM em 57 idiomas) com economia média de 97,6%.

Principais Recursos

  • Seletor: Pontuação ponderada por IDF seleciona apenas blocos relevantes por consulta. Usa prefixo estável + blocos dinâmicos selecionados por solicitação.
  • Esboços de Ferramentas: Carregamento preguiçoso de ferramentas em três níveis com esboços leves até que o modelo sinalize intenção de usar uma ferramenta específica.
  • Motor de Custos: Calculadora de economia consciente do provedor que conhece os 4 níveis de entrada da Anthropic e os preços de armazenamento em cache do Google.
  • Supressão de Ruído: Piso IDF + portas require-any para impedir que palavras comuns carreguem blocos irrelevantes em cada solicitação.
  • Ordenação Estável em Cache: Usa pontuações apenas para seleção, depois ordem alfabética para posição para manter os acertos de cache.
Ad

Detalhes Técnicos

Manipulação de contexto multi-turn: Esboços de ferramentas são conscientes do histórico. Se o modelo usou uma ferramenta em um turno anterior, o esquema completo permanece carregado para manter a continuidade da conversa.

Suporte a provedores: CAL é agnóstico ao provedor e funciona com qualquer provedor que tenha um endpoint de conclusões de chat. O motor de custos já lida com os 4 níveis de entrada da Anthropic e os preços de armazenamento em cache do Google.

Casos extremos: Usa pisos IDF e supressão de ruído para consultas ambíguas. Pontuação híbrida de palavras-chave+semântica está no roteiro.

Instalação e Licenciamento

pip install cal-context

Licenciado sob MIT. PyPI: https://pypi.org/project/cal-context/

GitHub: https://github.com/vjc-lab/context-assembly-layer

📖 Read the full source: r/openclaw

Ad

👀 See Also

Clawpage: Uma Ferramenta que Converte Conversas do OpenClaw em Sites Estáticos
Tools

Clawpage: Uma Ferramenta que Converte Conversas do OpenClaw em Sites Estáticos

Um desenvolvedor criou o Clawpage, uma habilidade que transforma o histórico de sessões do OpenClaw em páginas web estáticas para preservar conversas valiosas, incluindo o vai e vem, a pesquisa e o processo de depuração. A ferramenta está disponível no GitHub.

OpenClawRadar
Construindo um Agente de Voz com Latência Inferior a 500ms: Arquitetura e Insights de Desempenho
Tools

Construindo um Agente de Voz com Latência Inferior a 500ms: Arquitetura e Insights de Desempenho

Um desenvolvedor criou um agente de voz do zero, alcançando uma latência de ponta a ponta de aproximadamente 400ms com streaming completo de STT → LLM → TTS. As principais percepções incluem tratar a voz como um problema de revezamento de turnos, usar detecção semântica de fim de turno e colocar todos os componentes no mesmo local para latência mínima.

OpenClawRadar
Agentes de Codificação Paralela com tmux e Especificações em Markdown
Tools

Agentes de Codificação Paralela com tmux e Especificações em Markdown

Manuel Schipper descreve um sistema para executar 4-8 agentes de codificação paralelos usando tmux, arquivos Markdown, aliases bash e seis comandos de barra. A configuração usa especificações de Design de Funcionalidade (FD) em Markdown rastreadas através de um ciclo de vida de 8 estágios.

OpenClawRadar
BrowserKing: Extensão de Código Aberto do Chrome para Controle do Navegador via Claude e Outros Modelos
Tools

BrowserKing: Extensão de Código Aberto do Chrome para Controle do Navegador via Claude e Outros Modelos

BrowserKing é uma extensão gratuita e de código aberto para Chrome que permite que Claude e mais de 15 outros modelos vejam e controlem seu navegador a partir de um painel lateral. Ele tira capturas de tela, as envia para o modelo e, em seguida, age com base nas decisões para clicar em botões, preencher formulários, rolar a página e navegar entre abas.

OpenClawRadar