Como executar agentes OpenClaw gratuitamente usando APIs em nuvem ou modelos locais

Este guia aborda métodos práticos para executar agentes de codificação de IA OpenClaw sem gastar dinheiro, com base na experiência de um usuário do Reddit que executou um por mais de um mês sem custo algum.
Configuração de modelos em nuvem gratuitos
Para usuários sem hardware dedicado, as camadas gratuitas de API em nuvem oferecem o ponto de partida mais fácil. A fonte menciona três opções principais:
- OpenRouter: Cadastre-se sem cartão de crédito para acessar mais de 30 modelos gratuitos, incluindo Nemotron Ultra 253B (contexto de 262K), Llama 3.3 70B, MiniMax M2.5 e Devstral. A configuração usa JSON:
Alternativamente, use o roteador gratuito do OpenRouter:{ "agents": { "defaults": { "model": { "primary": "openrouter/nvidia/nemotron-ultra-253b:free" } } } }"primary": "openrouter/openrouter/free" - Camada gratuita do Gemini: Obtenha uma chave de API em ai.google.dev, depois execute
openclaw onboarde selecione Google. A camada gratuita é generosa o suficiente para uso diário casual. - Groq: Inferência rápida com camada gratuita limitada por taxa. Cadastre-se, obtenha uma chave de API e defina
GROQ_API_KEY.
A fonte observa que os modelos gratuitos em nuvem treinam com seus dados, tornando-os inadequados para informações sensíveis. Os limites de taxa tornam-se perceptíveis com 10 a 20+ interações diárias.
Modelos locais via Ollama
O Ollama tornou-se um provedor oficial do OpenClaw em março de 2026. A configuração envolve:
# instalar ollama
curl -fsSL https://ollama.com/install.sh | sh
# puxe um modelo baseado no seu hardware
ollama pull qwen3.5:27b # 20GB+ VRAM (RTX 3090/4090, M4 Pro/Max)
ollama pull qwen3.5:35b-a3b # 16GB VRAM (modelo MoE)
ollama pull qwen3.5:9b # 8GB VRAM (maioria dos laptops)
# execute a integração do openclaw e escolha Ollama
openclaw onboardSe a descoberta automática falhar ou o Ollama estiver rodando em uma máquina diferente: export OLLAMA_API_KEY="ollama-local"
Três dicas críticas de configuração da fonte:
- Use a URL nativa do Ollama (
http://localhost:11434), NÃO o endpoint compatível com OpenAI (http://localhost:11434/v1). O caminho /v1 quebra a chamada de ferramentas. - Defina
"reasoning": falseem configurações manuais de modelo. Quando habilitado, o OpenClaw envia prompts como função "developer", que o Ollama não suporta. - Defina
"api": "ollama"explicitamente na configuração do provedor para garantir o comportamento nativo de chamada de ferramentas.
A fonte observa que os modelos locais funcionam bem em máquinas robustas (Mac Studio, 3090/4090, 32GB+ RAM) para tarefas básicas de agentes. Em laptops com 8GB rodando modelos 9B, o desempenho é mais lento com tetos de qualidade mais baixos. O Qwen3.5 lida adequadamente com a chamada de ferramentas para tarefas diárias.
Configuração híbrida
A configuração real do autor usa Ollama/Qwen3.5 27B localmente para cerca de 70% das tarefas diárias (leitura de arquivos, calendário, resumos, consultas rápidas), com a camada gratuita do OpenRouter como fallback para raciocínios complexos de múltiplas etapas. O gasto mensal total permanece abaixo de US$ 3.
A abordagem é especificamente para usuários que desejam gastar literalmente nada ou quase nada. Para quem quer "barato" em vez de gratuito, a fonte menciona DeepSeek V3.2 (~US$ 1-2/dia), Minimax (assinatura de US$ 10/mês) e Kimi K2.5 como alternativas extremamente baratas que funcionam bem com o OpenClaw.
📖 Leia a fonte completa: r/openclaw
👀 See Also

Otimizando o AutoResearch no RTX 5090: O que falhou e o que funcionou
Um desenvolvedor compartilha detalhes específicos de configuração para executar o AutoResearch em uma configuração RTX 5090/Blackwell, incluindo abordagens que falharam e pareciam funcionais, mas tiveram desempenho ruim, e a configuração funcional que alcançou resultados estáveis com TOTAL_BATCH_SIZE=2**17 e TIME_BUDGET=1200.

Instalação do OpenClaw no MacBook Pro Usando Homebrew Local e NVM
Um usuário instalou com sucesso o OpenClaw em um MacBook Pro usando uma conta não administrativa com Homebrew local, NVM v0.40.4, Python 3.14.3 via pyenv, Node 24 e o LLM Qwen3.5-122B-A10B-MLX-vision-4.7-bit através do oMLX.

Projetando Restrições para Confiabilidade de Agentes de IA em Produção
Uma postagem no Reddit detalha uma abordagem baseada em restrições para usar o Claude em operações complexas de base de código, enfatizando a enumeração explícita de modos de falha, execução em fases com pontos de verificação e regras anti-atalhos para alcançar zero builds quebrados ao remover 140 arquivos.

Trellis 2 Executando com Sucesso no ROCm 7.11 com AMD RX 9070 XT
Um desenvolvedor conseguiu fazer o Trellis 2 funcionar no Linux Mint 22.3 com uma AMD RX 9070 XT usando ROCm 7.11, corrigindo dois problemas principais: instabilidade do ROCm com tensores N altos e uma função hipMemcpy2D quebrada no CuMesh.