Como Executar Agentes OpenClaw Grátis: APIs na Nuvem ou Local

Este guia aborda métodos práticos para executar agentes de codificação de IA OpenClaw sem gastar dinheiro, com base na experiência de um usuário do Reddit que executou um por mais de um mês sem custo algum.

Configuração de modelos em nuvem gratuitos

Para usuários sem hardware dedicado, as camadas gratuitas de API em nuvem oferecem o ponto de partida mais fácil. A fonte menciona três opções principais:

OpenRouter: Cadastre-se sem cartão de crédito para acessar mais de 30 modelos gratuitos, incluindo Nemotron Ultra 253B (contexto de 262K), Llama 3.3 70B, MiniMax M2.5 e Devstral. A configuração usa JSON:
```
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "openrouter/nvidia/nemotron-ultra-253b:free"
      }
    }
  }
}
```
Alternativamente, use o roteador gratuito do OpenRouter: "primary": "openrouter/openrouter/free"
Camada gratuita do Gemini: Obtenha uma chave de API em ai.google.dev, depois execute openclaw onboard e selecione Google. A camada gratuita é generosa o suficiente para uso diário casual.
Groq: Inferência rápida com camada gratuita limitada por taxa. Cadastre-se, obtenha uma chave de API e defina GROQ_API_KEY.

A fonte observa que os modelos gratuitos em nuvem treinam com seus dados, tornando-os inadequados para informações sensíveis. Os limites de taxa tornam-se perceptíveis com 10 a 20+ interações diárias.

Modelos locais via Ollama

O Ollama tornou-se um provedor oficial do OpenClaw em março de 2026. A configuração envolve:

# instalar ollama
curl -fsSL https://ollama.com/install.sh | sh
# puxe um modelo baseado no seu hardware
ollama pull qwen3.5:27b # 20GB+ VRAM (RTX 3090/4090, M4 Pro/Max)
ollama pull qwen3.5:35b-a3b # 16GB VRAM (modelo MoE)
ollama pull qwen3.5:9b # 8GB VRAM (maioria dos laptops)
# execute a integração do openclaw e escolha Ollama
openclaw onboard

Se a descoberta automática falhar ou o Ollama estiver rodando em uma máquina diferente: export OLLAMA_API_KEY="ollama-local"

Três dicas críticas de configuração da fonte:

Use a URL nativa do Ollama (http://localhost:11434), NÃO o endpoint compatível com OpenAI (http://localhost:11434/v1). O caminho /v1 quebra a chamada de ferramentas.
Defina "reasoning": false em configurações manuais de modelo. Quando habilitado, o OpenClaw envia prompts como função "developer", que o Ollama não suporta.
Defina "api": "ollama" explicitamente na configuração do provedor para garantir o comportamento nativo de chamada de ferramentas.

A fonte observa que os modelos locais funcionam bem em máquinas robustas (Mac Studio, 3090/4090, 32GB+ RAM) para tarefas básicas de agentes. Em laptops com 8GB rodando modelos 9B, o desempenho é mais lento com tetos de qualidade mais baixos. O Qwen3.5 lida adequadamente com a chamada de ferramentas para tarefas diárias.

Configuração híbrida

A configuração real do autor usa Ollama/Qwen3.5 27B localmente para cerca de 70% das tarefas diárias (leitura de arquivos, calendário, resumos, consultas rápidas), com a camada gratuita do OpenRouter como fallback para raciocínios complexos de múltiplas etapas. O gasto mensal total permanece abaixo de US$ 3.

A abordagem é especificamente para usuários que desejam gastar literalmente nada ou quase nada. Para quem quer "barato" em vez de gratuito, a fonte menciona DeepSeek V3.2 (~US$ 1-2/dia), Minimax (assinatura de US$ 10/mês) e Kimi K2.5 como alternativas extremamente baratas que funcionam bem com o OpenClaw.

📖 Leia a fonte completa: r/openclaw

Como executar agentes OpenClaw gratuitamente usando APIs em nuvem ou modelos locais

Configuração de modelos em nuvem gratuitos

Modelos locais via Ollama

Configuração híbrida

👀 See Also

Princípios de escrita de habilidades para Claude Code a partir de 159 habilidades de código aberto

OpenClaw 5.28: Plugin Codex Quebrado Após Atualização — Corrigir com Shim de Link Simbólico

Como a Memória do OpenCLAW Realmente Funciona: Corrigindo o 'Esquecimento' do Agente

Como Otimizar Sua Configuração do OpenClaw com Instruções Específicas e Refinamentos