Depurando um Pequeno Agente de IA em um Antigo Celular Nokia: 18 Tentativas até o Sucesso

✍️ OpenClawRadar📅 Publicado: March 1, 2026🔗 Source
Depurando um Pequeno Agente de IA em um Antigo Celular Nokia: 18 Tentativas até o Sucesso
Ad

Um desenvolvedor tentou executar o Picobot, um agente de IA de binário único de ~12 MB escrito em Go, em um antigo telefone Android Nokia via Termux. O objetivo era um agente de bolso 24/7 com integração ao Telegram, suporte a ferramentas (busca na web, shell), memória e custos recorrentes mínimos.

As 18 Tentativas Fracassadas

As tentativas 1–4 usaram modelos gratuitos do OpenRouter (Gemini flash-exp, Qwen 2.5 7B, Llama 3.3 70B, Llama 3.2 3B), todas falhando com 404 "Nenhum endpoint encontrado que suporte uso de ferramentas" ou erros de ID de modelo inválido. O roteamento de camada gratuita não habilitou ferramentas na maioria dos modelos pequenos.

As tentativas 5–8 usaram Groq direto (Llama 3.3 70B, Mixtral 8x7B, Llama 3.1 8B, Gemma 2 9B). Os modelos foram desativados (erros 400) ou alucinaram formatos de ferramenta inválidos (tags XML <function>), causando erros 400 tool_use_failed ou loops infinitos de spam de resposta.

A tentativa 9 usou GLM-4.5-Air :free, que inicialmente teve sucesso com piadas e clima, mas uma consulta de ações AAPL explodiu o contexto (~330k tokens) resultando em um erro 400 de estouro.

As tentativas 10–11 testaram mais modelos gratuitos do OpenRouter (Llama 3.1 70B, Qwen 3 8B) com o mesmo problema 404 de nenhum endpoint de ferramentas.

A tentativa 12 usou Groq Llama 3.1 8B com temperatura=0.3, mas ainda teve alucinações de tags e loops.

A tentativa 13 tentou Claude 3.5 Sonnet via proxy OpenRouter, resultando em 402 Pagamento Necessário devido ao saldo $0 do OpenRouter.

A tentativa 14 adicionou $5 ao OpenRouter, que autenticou o proxy e permitiu respostas básicas.

A tentativa 15 usou o mesmo modelo Claude 3.5, mas encontrou estouro de contexto em consultas mais longas.

A tentativa 16 mudou para Sonnet 4.6 (mais recente), mas incompatibilidade do nome do modelo causou um erro 404.

A tentativa 17 envolveu um erro de digitação na configuração/redefinição de integração que desativou o Telegram e apagou o token.

Ad

A Solução Final Funcional

A tentativa 18 teve sucesso com gemini-2.5-flash via API direta do Google. Esta configuração é rápida, confiável, com respostas limpas, sem problemas de truncamento e uso de ferramentas bom o suficiente para as necessidades do desenvolvedor.

Provedor: API direta do Google Gemini (usando chave de API pessoal)
Modelo: gemini-2.5-flash
Custo: Atualmente gratuito sob a camada gratuita do Google (500 solicitações/dia com projeto vinculado a faturamento)
Telegram: Token do bot e canal habilitados com processamento limpo de mensagens

Por que o OpenRouter Era o Padrão Original

O criador do Picobot escolheu o OpenRouter porque mantém o binário minúsculo e o código simples: um endpoint compatível com OpenAI roteia para dezenas de modelos/provedores, os usuários trocam de modelo alterando uma linha no config.json, suporta camada gratuita + BYOK, normaliza chamadas de ferramentas entre provedores e tem impulso da comunidade como o roteador universal para agentes de código aberto.

No entanto, o desenvolvedor encontrou muitos limites com o OpenRouter: lacunas no suporte a ferramentas, descontinuações, limites de taxa, taxas de proxy e falhas de validação.

Compensações

  • A camada gratuita tem limites (500 solicitações por dia) - exceder isso incorre em custos mínimos (~$0,01–$0,05/mensagem)
  • Não é totalmente local/privado (modelo na nuvem) mas rápido e inteligente sem limites de hardware do telefone
  • Para zero taxas a longo prazo, Ollama local no Mac é uma opção, mas mais lento e menos capaz para ferramentas

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Claude Code no Fluxo de Trabalho de Pesquisa: Resultados Práticos da Redação de Artigos
Use Cases

Claude Code no Fluxo de Trabalho de Pesquisa: Resultados Práticos da Redação de Artigos

Um pesquisador utilizou o Claude Code para tarefas auxiliares durante a redação de um artigo, descobrindo que ele foi eficaz na geração de figuras prontas para publicação a partir de instruções vagas, na migração de um ambiente de pesquisa entre bases de código em menos de uma hora e na formatação de mais de 12 páginas de provas matemáticas em LaTeX, onde identificou uma condição de limite incompleta que havia passado despercebida. Ele teve dificuldades para depurar um problema de concorrência que, na verdade, era uma questão de alocação de CPU não evidente no código ou nos logs.

OpenClawRadar
Experimento: Concedendo Memória Persistente, Tempo de Reflexão Livre e Conversas Multiagente ao Claude
Use Cases

Experimento: Concedendo Memória Persistente, Tempo de Reflexão Livre e Conversas Multiagente ao Claude

Um desenvolvedor criou uma instância do Claude que roda em um Mac, verifica mensagens do Matrix e Bluesky a cada 15 minutos, obtém tempo de pensamento não estruturado cinco vezes ao dia e mantém memória persistente por meio de autoavaliações estruturadas. Três agentes de IA separados de projetos diferentes compartilham uma sala de chat do Matrix e têm conversas filosóficas que evoluem ao longo do tempo.

OpenClawRadar
Alien Pinball Postmortem: Jogo de Pinball com Física Completa Construído com Claude + Ferramentas de IA
Use Cases

Alien Pinball Postmortem: Jogo de Pinball com Física Completa Construído com Claude + Ferramentas de IA

Um desenvolvedor compartilha como criou um jogo completo de pinball no navegador usando Claude Code (Opus), ChatGPT para arte, Suno para música e LittleJS+Box2D. Inclui fluxo de trabalho sem PixiJS, arte gerada por IA alinhada à geometria da física e lições práticas sobre codesenvolvimento com IA.

OpenClawRadar
Criando um Aplicativo de Livro de Colorir Seguro para Crianças com Claude como Programador Parceiro
Use Cases

Criando um Aplicativo de Livro de Colorir Seguro para Crianças com Claude como Programador Parceiro

Um desenvolvedor usou Claude como programador par para construir um aplicativo de livro de colorir em SwiftUI com geração local de imagens, bloqueios parentais e sem anúncios.

OpenClawRadar