ClawCut Proxy Otimiza LLMs Pequenos no GitHub

O ClawCut Proxy agora está disponível no GitHub como uma ferramenta experimental projetada para otimizar a interação do OpenClaw com LLMs locais, especialmente modelos menores que têm dificuldade com os prompts de sistema grandes padrão e as definições de ferramentas complexas do OpenClaw.

O que o ClawCut Resolve

O OpenClaw envia prompts de sistema massivos (frequentemente >28.000 caracteres) e definições de ferramentas JSON complexas para os LLMs. Enquanto modelos grandes em nuvem ou modelos locais de alto desempenho (14B+) lidam bem com isso, modelos pequenos (7B, 8B) executados em hardware limitado (Mac/MLX ou Raspberry Pi) sofrem com "Sobrecarga Cognitiva", levando a:

Latência extrema de processamento (Tempo Para Primeiro Token lento)
Modelos esquecendo sua identidade ou ferramentas disponíveis
Alucinação de respostas em texto em vez de executar scripts locais
Tempo limite de conexão ou respostas JSON malformadas
Consumo enorme de RAM

Como o ClawCut Funciona

O ClawCut atua como um "Homem no Meio" entre o OpenClaw e seu servidor LLM local com estes recursos de otimização:

APARAGEM DE PROMPT: Remove automaticamente habilidades padrão não utilizadas do prompt de sistema para manter a janela de contexto pequena e focada
AMNÉSIA INTELIGENTE: Trunca inteligentemente o histórico de conversa após execuções bem-sucedidas de ferramentas para liberar "espaço mental" para o modelo
FORÇADOR DE ATENÇÃO: Injeta um lembrete no final da consulta do usuário para garantir que o modelo priorize o uso de ferramentas
FORÇADOR DE FERRAMENTAS: Injeta palavras-chave para chamadas de ferramentas e aponta para comandos
RESGATE DE ENTRADA: Curto-circuita solicitações de entrada conhecidas (como Cron-Jobs) para contornar a latência do LLM e garantir 100% de confiabilidade para tarefas automatizadas
RESGATE BASH: Detecta chamadas de script mal formatadas (ex.: blocos de código nus) e as converte em chamadas de ferramenta OpenClaw válidas em tempo real
Filtra automaticamente carimbos de data dinâmicos dos prompts de sistema para permitir respostas quase instantâneas via cache de hardware
Traduz entre fluxos compatíveis com OpenAI (MLX) e o formato Ollama/NDJSON esperado pelo OpenClaw
Saída em console em tempo real da duração do preenchimento, contagem de tokens

Desempenho e Depuração

O ClawCut fornece tempos de resposta significativamente mais rápidos (TTFT) pois o modelo tem menos texto para processar inicialmente, confiabilidade aprimorada ao chamar scripts e tratamento robusto de erros para interrupções de fluxo ou erros de formatação. Com o DEBUG_MODE ativado, você pode inspecionar todo o "Ruído JSON" enviado pelo OpenClaw para entender exatamente o que o modelo está processando.

Quando Usar

Ideal para modelos pequenos (7B-8B) executados em hardware como Mac (MLX), Windows ou Linux, especialmente se seu modelo "conversa" demais em vez de executar comandos. Use com cautela se estiver usando modelos grandes altamente inteligentes (14B+) que podem lidar com prompts complexos nativamente. Neste caso, o proxy pode atuar puramente como um registrador e tradutor de formato sem manipular conteúdo se PASS_THROUGH_MODE = True.

📖 Leia a fonte completa: r/openclaw

ClawCut Proxy Lançado no GitHub para Otimizar OpenClaw para Pequenos LLMs

O que o ClawCut Resolve

Como o ClawCut Funciona

Desempenho e Depuração

Quando Usar

👀 See Also

Registro AbsolutelySkilled Adiciona 156 Habilidades Prontas para Produção para Claude Code

CtxSnap Extensão do VS Code Rastreia Alterações de Arquivos para Sessões do Claude

A Queda Silenciosa de Claude: A Falha da Camada de Ação Quando Agentes de IA Alcançam Sites de Negócios

Corvo do Conhecimento: Um Plugin de Base de Conhecimento Pesquisável para Claude