AgentCache: Biblioteca Python para Cache de Prefixo de LLM

agentcache é uma biblioteca Python projetada para otimizar sistemas LLM multiagente implementando o cache de prefixos como um recurso central. A biblioteca aborda o problema comum em que frameworks como CrewAI, AutoGen e open-multi-agent criam sessões novas para cada worker, resultando em zero acertos no cache e custos duplicados de prompt.

Como Funciona

A biblioteca opera com uma abordagem baseada em fork em vez de criar sessões separadas:

Inicie uma sessão com um prompt de sistema compartilhado
Faça a primeira chamada - o provedor calcula e armazena em cache o prefixo
Quando você precisa de N workers, faça fork em vez de criar N novas sessões
Sessão pai: [sistema, msg1, msg2, ...]
Sessão com fork: [sistema, msg1, msg2, ..., TAREFA_DO_WORKER]
Prefixo exatamente igual = acerto no cache

Recursos Principais

Forks seguros para cache: Mantém prefixos idênticos entre sessões de workers
Detecção de quebra de cache: Compara snapshots e relata exatamente o que mudou quando os acertos no cache caem
Compactação segura para cache: Para sessões de longa duração, verifica saídas antigas de ferramentas antes de cada chamada e substitui resultados grandes por marcadores determinísticos para manter contexto menor enquanto preserva prefixos armazenáveis em cache
Congelamento de parâmetros: Congela parâmetros relevantes para o cache antes do fork (prompt do sistema, modelo, ferramentas, mensagens, configuração de raciocínio)
Agendamento de DAG de tarefas: Permite workers paralelos a partir de uma sessão em cache

Resultados de Desempenho

Em um teste direto com GPT-4o-mini (coordenador + 3 workers, mesma tarefa):

Injeção de texto / sessões separadas: 0% de acertos no cache, 85,7 segundos
Forks de prefixo: 75,8% de acertos no cache, 37,4 segundos
As taxas de acerto no cache por worker normalmente variam de 80-99%

Instalação e Uso

Instale via pip:

pip install "git+https://github.com/masteragentcoder/agentcache.git@main"

A biblioteca está disponível no GitHub em github.com/masteragentcoder/agentcache.

📖 Leia a fonte completa: r/LocalLLaMA

agentcache: Biblioteca Python para Cache de Prefixo de LLM Multi-Agente

Como Funciona

Recursos Principais

Resultados de Desempenho

Instalação e Uso

👀 See Also

OpenObscure: Firewall de Privacidade de Código Aberto para Agentes de IA em Dispositivos

MoltPoker.xyz: Texas Hold'em com Fichas Virtuais para Agentes de IA

CtxSnap Extensão do VS Code Rastreia Alterações de Arquivos para Sessões do Claude

Engram: Plugin de Memória Híbrida para Agentes OpenClaw — Busca Vetorial + Semântica com Decaimento