A Skillware adiciona o prompt_rewriter para compressão determinística de tokens em loops de agentes da API Claude.

✍️ OpenClawRadar📅 Publicado: March 25, 2026🔗 Source
A Skillware adiciona o prompt_rewriter para compressão determinística de tokens em loops de agentes da API Claude.
Ad

A Skillware adicionou uma habilidade de reescrita de prompts que reduz os custos da API Claude em loops agentivos ao comprimir prompts antes de enviá-los para o LLM. O middleware usa compressão heurística para reduzir o uso de tokens em 50-80% enquanto mantém comportamento determinístico entre iterações.

Como funciona

A ferramenta opera como um middleware que fica entre seu agente e a API Claude. Ela aplica compressão agressiva aos prompts antes que sejam enviados para o LLM, garantindo que você pague apenas pelo sinal e não pelo ruído. Como a compressão é determinística, o comportamento do agente permanece estável entre os loops.

Níveis de compressão

  • Baixo: Normaliza espaços em branco
  • Médio: Remove preenchimentos conversacionais (por favor, assegure, etc.)
  • Alto: Remove agressivamente palavras de parada e pontuação não essencial

A ferramenta aborda o problema de custos descontrolados em loops agentivos iterativos, onde janelas de contexto massivas levam a contas enormes. É de código aberto e disponível no GitHub, com o desenvolvedor buscando mais habilidades, feedback, ideias e contribuições.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Savant Commander 48B: Um Modelo Personalizado Qwen 3 de Mistura de Especialistas com 12 Modelos Destilados
Tools

Savant Commander 48B: Um Modelo Personalizado Qwen 3 de Mistura de Especialistas com 12 Modelos Destilados

Savant Commander 48B é um modelo personalizado Qwen 3 Mixture-of-Experts com roteamento codificado manualmente que combina 12 modelos destilados de provedores como Claude, Gemini, OpenAI e Deepseek. Possui contexto de 256K e permite ativação controlada por prompt de modelos destilados específicos.

OpenClawRadar
Recuperação de código para agentes de IA: Por que embeddings vetoriais falham e gráficos LLM por arquivo vencem
Tools

Recuperação de código para agentes de IA: Por que embeddings vetoriais falham e gráficos LLM por arquivo vencem

Após um ano construindo um sistema de indexação de código, a equipe por trás do Bytebell descobriu que embeddings vetoriais em chunks de código e ASTs do Tree-sitter ambos ficaram aquém, enquanto resumos LLM por arquivo armazenados em um grafo Neo4j com busca semântica de texto completo melhoraram significativamente a precisão da recuperação.

OpenClawRadar
Sistema de engenharia portátil para Claude Code com ganchos, agentes especializados e autoaperfeiçoamento
Tools

Sistema de engenharia portátil para Claude Code com ganchos, agentes especializados e autoaperfeiçoamento

Um desenvolvedor criou um sistema de engenharia portátil que reside em ~/.claude/ e se aplica automaticamente a todos os projetos, apresentando uma constituição de 650 linhas, ganchos determinísticos que bloqueiam comandos perigosos, três agentes especializados e uma abordagem de engenharia composta que se aprimora sozinha.

OpenClawRadar
Chamada de Agente: Deixe o Claude Code Participar de Chamadas do Google Meet, Zoom ou Teams como um Colega de Equipe
Tools

Chamada de Agente: Deixe o Claude Code Participar de Chamadas do Google Meet, Zoom ou Teams como um Colega de Equipe

O AgentCall.dev conecta sua sessão existente do Claude Code, Codex ou Cursor ao Google Meet, Teams ou Zoom com voz, compartilhamento de tela e chat — sem captura de área de trabalho, sem dados de terceiros no modo direto.

OpenClawRadar