ClawCut Proxy Lançado no GitHub para Otimizar OpenClaw para Pequenos LLMs

O ClawCut Proxy agora está disponível no GitHub como uma ferramenta experimental projetada para otimizar a interação do OpenClaw com LLMs locais, especialmente modelos menores que têm dificuldade com os prompts de sistema grandes padrão e as definições de ferramentas complexas do OpenClaw.
O que o ClawCut Resolve
O OpenClaw envia prompts de sistema massivos (frequentemente >28.000 caracteres) e definições de ferramentas JSON complexas para os LLMs. Enquanto modelos grandes em nuvem ou modelos locais de alto desempenho (14B+) lidam bem com isso, modelos pequenos (7B, 8B) executados em hardware limitado (Mac/MLX ou Raspberry Pi) sofrem com "Sobrecarga Cognitiva", levando a:
- Latência extrema de processamento (Tempo Para Primeiro Token lento)
- Modelos esquecendo sua identidade ou ferramentas disponíveis
- Alucinação de respostas em texto em vez de executar scripts locais
- Tempo limite de conexão ou respostas JSON malformadas
- Consumo enorme de RAM
Como o ClawCut Funciona
O ClawCut atua como um "Homem no Meio" entre o OpenClaw e seu servidor LLM local com estes recursos de otimização:
- APARAGEM DE PROMPT: Remove automaticamente habilidades padrão não utilizadas do prompt de sistema para manter a janela de contexto pequena e focada
- AMNÉSIA INTELIGENTE: Trunca inteligentemente o histórico de conversa após execuções bem-sucedidas de ferramentas para liberar "espaço mental" para o modelo
- FORÇADOR DE ATENÇÃO: Injeta um lembrete no final da consulta do usuário para garantir que o modelo priorize o uso de ferramentas
- FORÇADOR DE FERRAMENTAS: Injeta palavras-chave para chamadas de ferramentas e aponta para comandos
- RESGATE DE ENTRADA: Curto-circuita solicitações de entrada conhecidas (como Cron-Jobs) para contornar a latência do LLM e garantir 100% de confiabilidade para tarefas automatizadas
- RESGATE BASH: Detecta chamadas de script mal formatadas (ex.: blocos de código nus) e as converte em chamadas de ferramenta OpenClaw válidas em tempo real
- Filtra automaticamente carimbos de data dinâmicos dos prompts de sistema para permitir respostas quase instantâneas via cache de hardware
- Traduz entre fluxos compatíveis com OpenAI (MLX) e o formato Ollama/NDJSON esperado pelo OpenClaw
- Saída em console em tempo real da duração do preenchimento, contagem de tokens
Desempenho e Depuração
O ClawCut fornece tempos de resposta significativamente mais rápidos (TTFT) pois o modelo tem menos texto para processar inicialmente, confiabilidade aprimorada ao chamar scripts e tratamento robusto de erros para interrupções de fluxo ou erros de formatação. Com o DEBUG_MODE ativado, você pode inspecionar todo o "Ruído JSON" enviado pelo OpenClaw para entender exatamente o que o modelo está processando.
Quando Usar
Ideal para modelos pequenos (7B-8B) executados em hardware como Mac (MLX), Windows ou Linux, especialmente se seu modelo "conversa" demais em vez de executar comandos. Use com cautela se estiver usando modelos grandes altamente inteligentes (14B+) que podem lidar com prompts complexos nativamente. Neste caso, o proxy pode atuar puramente como um registrador e tradutor de formato sem manipular conteúdo se PASS_THROUGH_MODE = True.
📖 Leia a fonte completa: r/openclaw
👀 See Also

Qwen3.6:27b + Agente Go Personalizado: Uma Alternativa Local ao Claude Code
Um desenvolvedor testa Qwen3.6:27b no Q8 em uma RTX 6000 (96GB), afirma que iguala o Claude Code para codificação diária e disponibiliza como código aberto um agente Go minimalista sem plugins ou MCP.

Tacit: Uma linguagem de programação LLM-First construída com Claude Code e Opus 4.7
Tacit é uma linguagem de programação experimental, pensada primeiro para LLMs, projetada e implementada usando Claude Code e Opus 4.7. Ela elimina conveniências humanas para minimizar o uso de tokens e vem com um primer que ensina LLMs de nível médio+ (Sonnet e superiores) a escrever código Tacit.

Crítica: CLI de binário único e foco local para revisar planos e diffs de agentes
Crit é um CLI de binário único que abre arquivos ou diffs no navegador com uma interface inspirada no GitHub, permitindo ciclos de feedback com agentes de IA — não precisa de conta.

Sistema de 7 Agentes no Claude Code Substitui Cerimônias de Sprint para Desenvolvedores Solo
Um ex-PM que virou dev solo construiu uma equipe de 7 agentes dentro do Claude Code que cuida de QA, revisão de PR, segurança, arquitetura e backlog — tudo acionado por um único comando /review.