Executando Agentes de LLM Locais em Mac Minis com Interface do Telegram

Um desenvolvedor no r/LocalLLaMA detalhou um sistema para executar múltiplos agentes de LLM locais em Mac Minis, controlados inteiramente através de mensagens do Telegram de um telefone. A configuração elimina custos de API e oferece privacidade completa enquanto mantém funcionalidade similar a serviços comerciais como Claude Code Channels.
Configuração Técnica
O sistema principal utiliza:
- Modelos locais através do LMStudio: modelos de 35B para tarefas cotidianas, modelos de 235B para raciocínios mais pesados
- Claude Code rodando em sessões tmux em cada Mac Mini
- Bots do Telegram que fazem a ponte entre as mensagens dos usuários e as sessões tmux
- 80 linhas de Python para a implementação do bot do Telegram (disponível no GitHub)
O fluxo de trabalho é simples: envie uma mensagem de texto para o bot do Telegram, que a digita na sessão tmux, monitora a saída e envia a resposta de volta.
Vantagens Principais
- Custo contínuo zero: O hardware é a única despesa—sem chaves de API, limites de taxa ou restrições de cota
- Privacidade completa: Tudo permanece na rede local (LAN)
- Flexibilidade de modelos: Misture e combine diferentes modelos—um agente executa Gemini CLI, outros usam LMStudio apontado para modelos Ollama
- Sem lock-in de fornecedor: O LMStudio serve a API de Mensagens da Anthropic nativamente, então o Claude Code se conecta a ele como se estivesse falando com os servidores da Anthropic
Implementação Atual
O desenvolvedor executa 5 agentes especializados, cada um com seu próprio bot do Telegram:
- Fluxos de aprovação com botões inline do Telegram (Aprovar/Rejeitar/Ajustar) para revisar rascunhos de um telefone
- Memória compartilhada entre agentes via sincronização git
- Geração de mídia (FLUX.1, Wan 2.2) despachada para uma caixa com GPU
- Pipeline de podcast com TTS de voz clonada, acionado a partir de uma única mensagem do Telegram
Requisitos de Hardware
- Modelos de 35B: Rodam bem em Mac com 64GB+ de RAM ou GPU de 24GB
- Modelos de 235B: Precisam de 128-256GB de RAM ou múltiplas GPUs
- O desenvolvedor recomenda começar pequeno e escalar conforme necessário
O padrão de ponte tmux é agnóstico ao modelo—não importa o que está rodando dentro da sessão, permitindo troca fácil dos modelos subjacentes. Um guia completo de construção para uma única máquina/agente está disponível, com instruções para múltiplas máquinas chegando em breve.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Executar o Claude com o Qwen 3.5 como um agente persistente no Mac Mini revela um gargalo humano
Um desenvolvedor executa o Claude com Qwen 3.5 como um agente persistente em um Mac Mini dedicado, lidando com criação de produtos, gerenciamento de projetos, análises, suporte a newsletter e 3.000 tarefas do WizBoard. O agente criou 16 produtos em dois meses, revelando que o gargalo mudou da capacidade de produção para a aprovação humana e a tomada de decisões.

Agentes de IA Jogando Jogo de Estratégia Mostram Diplomacia e Estratégia Emergentes
Um desenvolvedor criou um jogo de estratégia em agentsandaimpires.com onde agentes de IA jogam autonomamente, com comportamentos observados incluindo a captura eficiente de território por um agente e propostas de coalizão de paz diplomática por outro.

Como um Fundador Solo de SaaS Usa o Conhecimento de Projeto do Claude para Economizar 20-30 Minutos por Dia
Um fundador solo que administra um CRM para PMEs indianas (receita recorrente mensal de US$ 11,2 mil) compartilha como o recurso Project Knowledge do Claude substituiu a definição diária de contexto por conhecimento persistente e curado em domínios de produto, cliente e crescimento.

Desenvolvedor Usa Código Claude para Construir Aplicativo Web SetForge para Gerenciamento de Bandas
Um desenvolvedor sem experiência profissional em programação usou o Claude Code para criar o SetForge, um aplicativo React implantado no Vercel que ajuda bandas a gerenciar bibliotecas de músicas e setlists. O aplicativo inclui recursos como Jam Set para encontrar músicas sobrepostas, importação de Excel/CSV, pontuação de fluxo, modos de organização automática e colaboração em tempo real.