ClawCut Proxy Lançado no GitHub para Otimizar OpenClaw para Pequenos LLMs

✍️ OpenClawRadar📅 Publicado: March 15, 2026🔗 Source
ClawCut Proxy Lançado no GitHub para Otimizar OpenClaw para Pequenos LLMs
Ad

O ClawCut Proxy agora está disponível no GitHub como uma ferramenta experimental projetada para otimizar a interação do OpenClaw com LLMs locais, especialmente modelos menores que têm dificuldade com os prompts de sistema grandes padrão e as definições de ferramentas complexas do OpenClaw.

O que o ClawCut Resolve

O OpenClaw envia prompts de sistema massivos (frequentemente >28.000 caracteres) e definições de ferramentas JSON complexas para os LLMs. Enquanto modelos grandes em nuvem ou modelos locais de alto desempenho (14B+) lidam bem com isso, modelos pequenos (7B, 8B) executados em hardware limitado (Mac/MLX ou Raspberry Pi) sofrem com "Sobrecarga Cognitiva", levando a:

  • Latência extrema de processamento (Tempo Para Primeiro Token lento)
  • Modelos esquecendo sua identidade ou ferramentas disponíveis
  • Alucinação de respostas em texto em vez de executar scripts locais
  • Tempo limite de conexão ou respostas JSON malformadas
  • Consumo enorme de RAM

Como o ClawCut Funciona

O ClawCut atua como um "Homem no Meio" entre o OpenClaw e seu servidor LLM local com estes recursos de otimização:

  • APARAGEM DE PROMPT: Remove automaticamente habilidades padrão não utilizadas do prompt de sistema para manter a janela de contexto pequena e focada
  • AMNÉSIA INTELIGENTE: Trunca inteligentemente o histórico de conversa após execuções bem-sucedidas de ferramentas para liberar "espaço mental" para o modelo
  • FORÇADOR DE ATENÇÃO: Injeta um lembrete no final da consulta do usuário para garantir que o modelo priorize o uso de ferramentas
  • FORÇADOR DE FERRAMENTAS: Injeta palavras-chave para chamadas de ferramentas e aponta para comandos
  • RESGATE DE ENTRADA: Curto-circuita solicitações de entrada conhecidas (como Cron-Jobs) para contornar a latência do LLM e garantir 100% de confiabilidade para tarefas automatizadas
  • RESGATE BASH: Detecta chamadas de script mal formatadas (ex.: blocos de código nus) e as converte em chamadas de ferramenta OpenClaw válidas em tempo real
  • Filtra automaticamente carimbos de data dinâmicos dos prompts de sistema para permitir respostas quase instantâneas via cache de hardware
  • Traduz entre fluxos compatíveis com OpenAI (MLX) e o formato Ollama/NDJSON esperado pelo OpenClaw
  • Saída em console em tempo real da duração do preenchimento, contagem de tokens
Ad

Desempenho e Depuração

O ClawCut fornece tempos de resposta significativamente mais rápidos (TTFT) pois o modelo tem menos texto para processar inicialmente, confiabilidade aprimorada ao chamar scripts e tratamento robusto de erros para interrupções de fluxo ou erros de formatação. Com o DEBUG_MODE ativado, você pode inspecionar todo o "Ruído JSON" enviado pelo OpenClaw para entender exatamente o que o modelo está processando.

Quando Usar

Ideal para modelos pequenos (7B-8B) executados em hardware como Mac (MLX), Windows ou Linux, especialmente se seu modelo "conversa" demais em vez de executar comandos. Use com cautela se estiver usando modelos grandes altamente inteligentes (14B+) que podem lidar com prompts complexos nativamente. Neste caso, o proxy pode atuar puramente como um registrador e tradutor de formato sem manipular conteúdo se PASS_THROUGH_MODE = True.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also