Construindo um Assistente de Voz com OpenClaw, Alexa e LLM Local

Um desenvolvedor compartilhou sua implementação de um assistente com foco em voz que usa o OpenClaw como estrutura principal do agente de IA, integrado com a Alexa para interação por voz e um LLM local para lidar com consultas de forma econômica.
Como Funciona
O sistema é acionado ao dizer "Alexa, abra Lucy" para uma skill personalizada da Alexa. As consultas são processadas por um sistema de roteamento de quatro níveis:
- Caminho rápido (0ms): Lida com hora, data e respostas pré-definidas
- LLM local Ollama (<1s): Usa o Qwen 2.5 3B para consultas de conhecimento geral, rodando em um Mac Mini com Apple Silicon
- Agente Claude (5-12s): Lida com contexto pessoal, memória e raciocínio complexo
- Adiado + ferramentas (até 2min): Gerencia e-mail, busca na web e consultas de banco de dados via TTS do Home Assistant
As respostas retornam para o mesmo dispositivo Alexa que iniciou a consulta, detectado automaticamente pelo recurso last_called do Home Assistant. O sistema usa Piper TTS no Home Assistant para saída de voz neural em espanhol nos alto-falantes Sonos e pode fornecer resumos matinais com dados de mercado, informações de calendário e métricas de negócios.
Stack Técnico
- OpenClaw: Estrutura principal do agente de IA com suporte a Telegram, Alexa e interfaces de voz
- Alexa Custom Skill: Proxy Node.js com autenticação por PIN e encadeamento de sessões
- Ollama + Qwen 2.5 3B: LLM local que fornece respostas de ~0.5s
- Home Assistant: Integra Alexa Media Player, Piper TTS e roteamento de dispositivos
- Piper TTS: Voz neural em espanhol para alto-falantes Sonos
Detalhes Principais da Implementação
O desenvolvedor descobriu que usar um LLM local economiza aproximadamente 80% dos custos de API para perguntas simples que não exigem o Claude. No entanto, eles observaram que os modelos locais "alucinam livremente" e adicionaram um filtro de desvio para consultas de negócios e finanças.
O reconhecimento de fala da Alexa foi identificado como o gargalo, com AMAZON.SearchQuery e múltiplas amostras de enunciados ajudando a melhorar a precisão. A autenticação usa userId em vez de sessionId, pois a Alexa gera novas sessões para cada invocação. O desenvolvedor persiste a autenticação em arquivo porque os Maps na memória não sobrevivem a reinicializações do proxy.
O código do proxy está disponível como código aberto: openclaw-alexa-voice. Planos futuros incluem detecção de palavra de ativação ("Hey Lucy"), controle de casa inteligente e roteamento de alto-falantes baseado em presença.
📖 Leia a fonte completa: r/openclaw
👀 See Also

Coordenação de Múltiplos Agentes de IA: Discord, Tarefas Agendadas e Hierarquia Clara
Um desenvolvedor executando três agentes OpenClaw resolveu problemas de coordenação usando o Discord como canal de comunicação compartilhado, substituindo o caro sistema de heartbeat do Paperclip por cron jobs por agente e estabelecendo uma hierarquia clara de liderança entre os modelos Claude Max e OpenAI.

Reduzindo os Custos de Agentes de IA em 30% por Meio de Monitoramento de Comportamento e Alterações de Configuração
Um desenvolvedor reduziu o uso de tokens do seu bot OpenClaw em 30% após descobrir que 70 tarefas cron estavam despejando resultados na sessão principal do chat, causando inchaço de contexto e compactação repetida. A solução envolveu redirecionar as saídas das tarefas cron diretamente para o Telegram e criar uma habilidade de monitoramento para identificar ineficiências como pesquisas redundantes e leituras de arquivos excessivamente grandes.

Fluxo de Trabalho de Prospecção e Engajamento no LinkedIn Criado com Claude
Um desenvolvedor criou um fluxo de trabalho de prospecção no LinkedIn usando o Claude que identifica prospects relevantes, categoriza leads, encontra postagens recentes e gerencia o engajamento por meio de curtidas, comentários e solicitações de conexão. O sistema prioriza perfis com maior engajamento e ignora os inativos.

Usando LLM Local para Monitorar Sessões AFK de Bot no Minecraft
Um desenvolvedor utilizou um LLM local para monitorar seu bot do Minecraft executando Baritone para tarefas de mineração, configurando monitoramento de tela para receber alertas quando o bot morre ou se desconecta do servidor.