Como executar agentes OpenClaw gratuitamente usando APIs em nuvem ou modelos locais

✍️ OpenClawRadar📅 Publicado: April 14, 2026🔗 Source
Como executar agentes OpenClaw gratuitamente usando APIs em nuvem ou modelos locais
Ad

Este guia aborda métodos práticos para executar agentes de codificação de IA OpenClaw sem gastar dinheiro, com base na experiência de um usuário do Reddit que executou um por mais de um mês sem custo algum.

Configuração de modelos em nuvem gratuitos

Para usuários sem hardware dedicado, as camadas gratuitas de API em nuvem oferecem o ponto de partida mais fácil. A fonte menciona três opções principais:

  • OpenRouter: Cadastre-se sem cartão de crédito para acessar mais de 30 modelos gratuitos, incluindo Nemotron Ultra 253B (contexto de 262K), Llama 3.3 70B, MiniMax M2.5 e Devstral. A configuração usa JSON:
    {
      "agents": {
        "defaults": {
          "model": {
            "primary": "openrouter/nvidia/nemotron-ultra-253b:free"
          }
        }
      }
    }
    Alternativamente, use o roteador gratuito do OpenRouter: "primary": "openrouter/openrouter/free"
  • Camada gratuita do Gemini: Obtenha uma chave de API em ai.google.dev, depois execute openclaw onboard e selecione Google. A camada gratuita é generosa o suficiente para uso diário casual.
  • Groq: Inferência rápida com camada gratuita limitada por taxa. Cadastre-se, obtenha uma chave de API e defina GROQ_API_KEY.

A fonte observa que os modelos gratuitos em nuvem treinam com seus dados, tornando-os inadequados para informações sensíveis. Os limites de taxa tornam-se perceptíveis com 10 a 20+ interações diárias.

Ad

Modelos locais via Ollama

O Ollama tornou-se um provedor oficial do OpenClaw em março de 2026. A configuração envolve:

# instalar ollama
curl -fsSL https://ollama.com/install.sh | sh
# puxe um modelo baseado no seu hardware
ollama pull qwen3.5:27b # 20GB+ VRAM (RTX 3090/4090, M4 Pro/Max)
ollama pull qwen3.5:35b-a3b # 16GB VRAM (modelo MoE)
ollama pull qwen3.5:9b # 8GB VRAM (maioria dos laptops)
# execute a integração do openclaw e escolha Ollama
openclaw onboard

Se a descoberta automática falhar ou o Ollama estiver rodando em uma máquina diferente: export OLLAMA_API_KEY="ollama-local"

Três dicas críticas de configuração da fonte:

  • Use a URL nativa do Ollama (http://localhost:11434), NÃO o endpoint compatível com OpenAI (http://localhost:11434/v1). O caminho /v1 quebra a chamada de ferramentas.
  • Defina "reasoning": false em configurações manuais de modelo. Quando habilitado, o OpenClaw envia prompts como função "developer", que o Ollama não suporta.
  • Defina "api": "ollama" explicitamente na configuração do provedor para garantir o comportamento nativo de chamada de ferramentas.

A fonte observa que os modelos locais funcionam bem em máquinas robustas (Mac Studio, 3090/4090, 32GB+ RAM) para tarefas básicas de agentes. Em laptops com 8GB rodando modelos 9B, o desempenho é mais lento com tetos de qualidade mais baixos. O Qwen3.5 lida adequadamente com a chamada de ferramentas para tarefas diárias.

Configuração híbrida

A configuração real do autor usa Ollama/Qwen3.5 27B localmente para cerca de 70% das tarefas diárias (leitura de arquivos, calendário, resumos, consultas rápidas), com a camada gratuita do OpenRouter como fallback para raciocínios complexos de múltiplas etapas. O gasto mensal total permanece abaixo de US$ 3.

A abordagem é especificamente para usuários que desejam gastar literalmente nada ou quase nada. Para quem quer "barato" em vez de gratuito, a fonte menciona DeepSeek V3.2 (~US$ 1-2/dia), Minimax (assinatura de US$ 10/mês) e Kimi K2.5 como alternativas extremamente baratas que funcionam bem com o OpenClaw.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Otimizando o AutoResearch no RTX 5090: O que falhou e o que funcionou
Guides

Otimizando o AutoResearch no RTX 5090: O que falhou e o que funcionou

Um desenvolvedor compartilha detalhes específicos de configuração para executar o AutoResearch em uma configuração RTX 5090/Blackwell, incluindo abordagens que falharam e pareciam funcionais, mas tiveram desempenho ruim, e a configuração funcional que alcançou resultados estáveis com TOTAL_BATCH_SIZE=2**17 e TIME_BUDGET=1200.

OpenClawRadar
Instalação do OpenClaw no MacBook Pro Usando Homebrew Local e NVM
Guides

Instalação do OpenClaw no MacBook Pro Usando Homebrew Local e NVM

Um usuário instalou com sucesso o OpenClaw em um MacBook Pro usando uma conta não administrativa com Homebrew local, NVM v0.40.4, Python 3.14.3 via pyenv, Node 24 e o LLM Qwen3.5-122B-A10B-MLX-vision-4.7-bit através do oMLX.

OpenClawRadar
Projetando Restrições para Confiabilidade de Agentes de IA em Produção
Guides

Projetando Restrições para Confiabilidade de Agentes de IA em Produção

Uma postagem no Reddit detalha uma abordagem baseada em restrições para usar o Claude em operações complexas de base de código, enfatizando a enumeração explícita de modos de falha, execução em fases com pontos de verificação e regras anti-atalhos para alcançar zero builds quebrados ao remover 140 arquivos.

OpenClawRadar
Trellis 2 Executando com Sucesso no ROCm 7.11 com AMD RX 9070 XT
Guides

Trellis 2 Executando com Sucesso no ROCm 7.11 com AMD RX 9070 XT

Um desenvolvedor conseguiu fazer o Trellis 2 funcionar no Linux Mint 22.3 com uma AMD RX 9070 XT usando ROCm 7.11, corrigindo dois problemas principais: instabilidade do ROCm com tensores N altos e uma função hipMemcpy2D quebrada no CuMesh.

OpenClawRadar