A Skillware adiciona o prompt_rewriter para compressão determinística de tokens em loops de agentes da API Claude.

A Skillware adicionou uma habilidade de reescrita de prompts que reduz os custos da API Claude em loops agentivos ao comprimir prompts antes de enviá-los para o LLM. O middleware usa compressão heurística para reduzir o uso de tokens em 50-80% enquanto mantém comportamento determinístico entre iterações.
Como funciona
A ferramenta opera como um middleware que fica entre seu agente e a API Claude. Ela aplica compressão agressiva aos prompts antes que sejam enviados para o LLM, garantindo que você pague apenas pelo sinal e não pelo ruído. Como a compressão é determinística, o comportamento do agente permanece estável entre os loops.
Níveis de compressão
- Baixo: Normaliza espaços em branco
- Médio: Remove preenchimentos conversacionais (por favor, assegure, etc.)
- Alto: Remove agressivamente palavras de parada e pontuação não essencial
A ferramenta aborda o problema de custos descontrolados em loops agentivos iterativos, onde janelas de contexto massivas levam a contas enormes. É de código aberto e disponível no GitHub, com o desenvolvedor buscando mais habilidades, feedback, ideias e contribuições.
📖 Read the full source: r/ClaudeAI
👀 See Also

Savant Commander 48B: Um Modelo Personalizado Qwen 3 de Mistura de Especialistas com 12 Modelos Destilados
Savant Commander 48B é um modelo personalizado Qwen 3 Mixture-of-Experts com roteamento codificado manualmente que combina 12 modelos destilados de provedores como Claude, Gemini, OpenAI e Deepseek. Possui contexto de 256K e permite ativação controlada por prompt de modelos destilados específicos.

Recuperação de código para agentes de IA: Por que embeddings vetoriais falham e gráficos LLM por arquivo vencem
Após um ano construindo um sistema de indexação de código, a equipe por trás do Bytebell descobriu que embeddings vetoriais em chunks de código e ASTs do Tree-sitter ambos ficaram aquém, enquanto resumos LLM por arquivo armazenados em um grafo Neo4j com busca semântica de texto completo melhoraram significativamente a precisão da recuperação.

Sistema de engenharia portátil para Claude Code com ganchos, agentes especializados e autoaperfeiçoamento
Um desenvolvedor criou um sistema de engenharia portátil que reside em ~/.claude/ e se aplica automaticamente a todos os projetos, apresentando uma constituição de 650 linhas, ganchos determinísticos que bloqueiam comandos perigosos, três agentes especializados e uma abordagem de engenharia composta que se aprimora sozinha.

Chamada de Agente: Deixe o Claude Code Participar de Chamadas do Google Meet, Zoom ou Teams como um Colega de Equipe
O AgentCall.dev conecta sua sessão existente do Claude Code, Codex ou Cursor ao Google Meet, Teams ou Zoom com voz, compartilhamento de tela e chat — sem captura de área de trabalho, sem dados de terceiros no modo direto.