ToolLoop: Framework de Agente de Código Aberto para Ferramentas no Estilo Claude com Qualquer Modelo

O que o ToolLoop faz
ToolLoop é um framework Python de código aberto criado para fornecer funcionalidade no estilo Claude Code sem ficar preso a um único provedor. O framework inclui 11 ferramentas que abrangem operações de arquivo, busca de código, acesso ao shell e subagentes, e funciona com qualquer LLM através da integração com LiteLLM.
Principais recursos
- Framework de código aberto escrito em Python
- Aproximadamente 2.700 linhas de código
- 11 ferramentas integradas: operações de arquivo, busca de código, shell, subagentes
- Funciona com qualquer LLM através do LiteLLM
- Suporta qualquer modelo no Bedrock (DeepSeek, Llama, Mistral) ou qualquer API (OpenAI, Moonshot, endpoints locais)
- Alternar modelos no meio da conversa com contexto compartilhado
- As mesmas ferramentas e prompts funcionam em diferentes modelos
Exemplo de código
Aqui está o exemplo de uso do SDK da fonte:
from sdk import query, ToolLoopOptions
async for event in query(
prompt="Find all TODO comments, fix them, run the tests",
options=ToolLoopOptions(
model="bedrock/converse/deepseek.v3.2",
allowed_tools=["Read", "Edit", "Grep", "Glob", "Bash"],
),
):
print(event)
Você pode substituir deepseek.v3.2 por qualquer modelo mantendo as mesmas ferramentas e estrutura de prompt.
Para quem é isso
Desenvolvedores que desejam funcionalidade de agente no estilo Claude Code, mas precisam de flexibilidade para usar diferentes modelos em vários provedores e configurações locais.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

PicoClaw Falha na Construção do Agente de IA F1, Gasta US$ 20 em Créditos de API
Um desenvolvedor tentou construir um bot de informações da F1 usando PicoClaw em um Raspberry Pi Zero 2W, mas a ferramenta usou a versão 11 por padrão, gerou código Python alucinado e consumiu US$ 20 em créditos da API DeepSeek sem produzir uma solução funcional.

Camada de Memória Auto-Hospedada para o Claude Roda Gratuitamente na Cloudflare
Um servidor MCP Cloudflare Worker permite que o Claude se lembre e recupere notas por meio de pesquisa semântica usando Workers AI e Vectorize — tudo no nível gratuito.

Desenvolvimento de IA Local com Qwen3.6-27B e Opencode em uma 5090
Um usuário do Reddit compartilha sua experiência ao migrar de ferramentas de IA de codificação na nuvem (Claude Code, Cursor) para uma configuração local usando Opencode + llama-server + Qwen3.6-27B com contexto de 128K em uma única RTX 5090, citando liberdade de limites de uso e riscos de conta.

Microsoft VibeVoice: Modelos ASR de 60 Min e TTS de 90 Min de Código Aberto
VibeVoice é uma família de modelos de voz IA de código aberto da Microsoft, incluindo ASR (passagem única de 60 minutos, diarização de falantes, mais de 50 idiomas) e TTS (90 minutos com múltiplos falantes, streaming em tempo real). Utiliza tokenizadores de fala contínuos de 7,5 Hz e difusão de próximo token.