Usando um LLM Local como Subagente de Código do Claude para Reduzir o Uso de Contexto

✍️ OpenClawRadar📅 Publicado: March 2, 2026🔗 Source
Usando um LLM Local como Subagente de Código do Claude para Reduzir o Uso de Contexto
Ad

O Claude Code pode orquestrar tarefas delegando para um LLM local executado em sua máquina, semelhante a como usa subagentes do Claude. Essa abordagem mantém o conteúdo dos arquivos fora do contexto do Claude—apenas o resumo e as percepções do modelo local são repassados.

Como Funciona

Um pequeno script Python (~120 linhas, apenas biblioteca padrão) executa um loop de agente:

  • Você passa ao Claude uma descrição da tarefa sem o conteúdo do arquivo
  • O script a envia para o endpoint /v1/chat/completions do LM Studio com definições de ferramentas read_file e list_dir
  • O modelo local chama essas ferramentas para ler os arquivos de que precisa
  • O loop continua até produzir uma resposta final
  • O Claude vê apenas o resultado

Exemplo de comando:

python3 agent_lm.py --dir /caminho/para/projeto "resumir solar-system.html"

Isso resulta em:

  • [turno 1] → read_file({'path': 'solar-system.html'})
  • [turno 2] → Este arquivo HTML cria um sistema solar animado interativo...

O conteúdo do arquivo vai para o contexto do modelo local (testado com o contexto do Qwen), não do Claude.

Ad

Casos de Uso e Limitações

Com base em testes com Qwen3.5 35B 4-bit via MLX no Apple Silicon, essa abordagem é boa para:

  • Resumo e explicação de código
  • Encontrar bugs
  • Geração de boilerplate / primeiro rascunho
  • Transformação e tradução de texto (testado com hebraico)
  • Tarefas de lógica e raciocínio (use a flag --think para problemas mais difíceis)

Não é bom para:

  • Tarefas que exigem o contexto completo do Claude
  • Compreensão de múltiplos arquivos onde relacionamentos importam
  • Tarefas que precisam do histórico atual da conversa
  • Qualquer coisa onde a precisão seja crítica

Pense nisso como um assistente de nível Haiku, não como um substituto para o Claude.

Requisitos de Configuração

  • LM Studio executando localmente com o servidor de API habilitado
  • Um script Python para o loop do agente, outro para consultas simples apenas com prompt
  • Ambos conectados a um ~/.claude/CLAUDE.md global para que o Claude Code saiba oferecer delegação quando relevante
  • Nenhum servidor MCP, nenhuma dependência pip, nenhuma infraestrutura de plugin necessária

Dica de configuração: Adicione {%- set enable_thinking = false %} ao topo do template Jinja. Para a maioria das tarefas, você não precisa que o modelo local raciocine, e isso economiza tempo e tokens enquanto aumenta a velocidade sem degradação real na qualidade para tais tarefas.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

Resultados Práticos de 11 Construções de Software Multiagente sem Scaffolding Programático
Tools

Resultados Práticos de 11 Construções de Software Multiagente sem Scaffolding Programático

Análise de 11 construções autônomas de multiagentes mostra que a aplicação de escopo funciona mecanicamente (20/20 sucessos) não por meio de prompts (0/20), os custos de orquestração são dominados pela reingestão de memória (~95% do gasto de entrada), e a capacidade do modelo do trabalhador cria lacunas de produtividade de 9,8x.

OpenClawRadar
ApexClaw: Agente de IA de Código Aberto para Telegram com Mais de 85 Ferramentas para Automação Web, Voz e E-mail
Tools

ApexClaw: Agente de IA de Código Aberto para Telegram com Mais de 85 Ferramentas para Automação Web, Voz e E-mail

ApexClaw é um agente de IA de código aberto para Telegram escrito em Go que oferece mais de 85 ferramentas integradas, incluindo navegação na web com Chrome headless, processamento de notas de voz, integração com Gmail e execução de scripts shell. É auto-hospedado e utiliza o mecanismo z.ai para raciocínio.

OpenClawRadar
Ponte IDE Claude de Código Aberto Conecta Dispatch, Aplicativo Desktop e Claude Code
Tools

Ponte IDE Claude de Código Aberto Conecta Dispatch, Aplicativo Desktop e Claude Code

O claude-ide-bridge é uma ferramenta de código aberto licenciada pelo MIT que conecta o Claude Code ao seu IDE, fornecendo acesso a LSP, depurador, terminais, git e GitHub através de 124 ferramentas. Ele permite um fluxo de trabalho onde tarefas enviadas via Dispatch de um telefone são tratadas pelo aplicativo de desktop Claude, que usa o Claude Code para escrever código e executar testes enquanto interage com o IDE.

OpenClawRadar
Kit de Ferramentas de Viagem Hacking: Habilidades em IA e Servidores MCP para Busca de Pontos e Milhas
Tools

Kit de Ferramentas de Viagem Hacking: Habilidades em IA e Servidores MCP para Busca de Pontos e Milhas

Um repositório do GitHub fornece 7 habilidades em markdown e 6 servidores MCP que ensinam o Claude Code e o OpenCode a pesquisar voos com milhas em mais de 25 programas de fidelidade, comparar preços em dinheiro, consultar saldos de programas de fidelidade e encontrar hotéis e balsas. A configuração requer clonar o repositório e executar o setup.sh.

OpenClawRadar