CAL: Camada de Otimização de Contexto de Código Aberto para Agentes de LLM

O que o CAL faz
CAL é uma biblioteca Python que fica entre seu código existente e as chamadas de API de LLM, selecionando, comprimindo e montando o contexto de forma inteligente para cada solicitação. Ele aborda os problemas de custo e contexto em configurações de agentes com muitos tokens, particularmente relevante com as recentes mudanças nas assinaturas Claude Pro/Max.
Benchmarks de Desempenho
Em produção com Claude Opus 4 e 103 blocos de contexto:
- Sem CAL: Cada solicitação envia todos os 103 blocos (~23.000 tokens) a US$ 0,043 por solicitação
- Com CAL: Reduz para ~6 blocos e 4.100 tokens a US$ 0,008 por solicitação
- Resultados: Redução de 83% nos tokens, redução de 81% no custo
Validado com 5.000 prompts do WildChat (um conjunto de dados acadêmico aberto de conversas reais de LLM em 57 idiomas) com economia média de 97,6%.
Principais Recursos
- Seletor: Pontuação ponderada por IDF seleciona apenas blocos relevantes por consulta. Usa prefixo estável + blocos dinâmicos selecionados por solicitação.
- Esboços de Ferramentas: Carregamento preguiçoso de ferramentas em três níveis com esboços leves até que o modelo sinalize intenção de usar uma ferramenta específica.
- Motor de Custos: Calculadora de economia consciente do provedor que conhece os 4 níveis de entrada da Anthropic e os preços de armazenamento em cache do Google.
- Supressão de Ruído: Piso IDF + portas require-any para impedir que palavras comuns carreguem blocos irrelevantes em cada solicitação.
- Ordenação Estável em Cache: Usa pontuações apenas para seleção, depois ordem alfabética para posição para manter os acertos de cache.
Detalhes Técnicos
Manipulação de contexto multi-turn: Esboços de ferramentas são conscientes do histórico. Se o modelo usou uma ferramenta em um turno anterior, o esquema completo permanece carregado para manter a continuidade da conversa.
Suporte a provedores: CAL é agnóstico ao provedor e funciona com qualquer provedor que tenha um endpoint de conclusões de chat. O motor de custos já lida com os 4 níveis de entrada da Anthropic e os preços de armazenamento em cache do Google.
Casos extremos: Usa pisos IDF e supressão de ruído para consultas ambíguas. Pontuação híbrida de palavras-chave+semântica está no roteiro.
Instalação e Licenciamento
pip install cal-context
Licenciado sob MIT. PyPI: https://pypi.org/project/cal-context/
GitHub: https://github.com/vjc-lab/context-assembly-layer
📖 Read the full source: r/openclaw
👀 See Also

Clawpage: Uma Ferramenta que Converte Conversas do OpenClaw em Sites Estáticos
Um desenvolvedor criou o Clawpage, uma habilidade que transforma o histórico de sessões do OpenClaw em páginas web estáticas para preservar conversas valiosas, incluindo o vai e vem, a pesquisa e o processo de depuração. A ferramenta está disponível no GitHub.

Construindo um Agente de Voz com Latência Inferior a 500ms: Arquitetura e Insights de Desempenho
Um desenvolvedor criou um agente de voz do zero, alcançando uma latência de ponta a ponta de aproximadamente 400ms com streaming completo de STT → LLM → TTS. As principais percepções incluem tratar a voz como um problema de revezamento de turnos, usar detecção semântica de fim de turno e colocar todos os componentes no mesmo local para latência mínima.

Agentes de Codificação Paralela com tmux e Especificações em Markdown
Manuel Schipper descreve um sistema para executar 4-8 agentes de codificação paralelos usando tmux, arquivos Markdown, aliases bash e seis comandos de barra. A configuração usa especificações de Design de Funcionalidade (FD) em Markdown rastreadas através de um ciclo de vida de 8 estágios.

BrowserKing: Extensão de Código Aberto do Chrome para Controle do Navegador via Claude e Outros Modelos
BrowserKing é uma extensão gratuita e de código aberto para Chrome que permite que Claude e mais de 15 outros modelos vejam e controlem seu navegador a partir de um painel lateral. Ele tira capturas de tela, as envia para o modelo e, em seguida, age com base nas decisões para clicar em botões, preencher formulários, rolar a página e navegar entre abas.