Construindo um Assistente de Voz com OpenClaw, Alexa e LLM Local

✍️ OpenClawRadar📅 Publicado: March 1, 2026🔗 Source
Construindo um Assistente de Voz com OpenClaw, Alexa e LLM Local
Ad

Um desenvolvedor compartilhou sua implementação de um assistente com foco em voz que usa o OpenClaw como estrutura principal do agente de IA, integrado com a Alexa para interação por voz e um LLM local para lidar com consultas de forma econômica.

Como Funciona

O sistema é acionado ao dizer "Alexa, abra Lucy" para uma skill personalizada da Alexa. As consultas são processadas por um sistema de roteamento de quatro níveis:

  • Caminho rápido (0ms): Lida com hora, data e respostas pré-definidas
  • LLM local Ollama (<1s): Usa o Qwen 2.5 3B para consultas de conhecimento geral, rodando em um Mac Mini com Apple Silicon
  • Agente Claude (5-12s): Lida com contexto pessoal, memória e raciocínio complexo
  • Adiado + ferramentas (até 2min): Gerencia e-mail, busca na web e consultas de banco de dados via TTS do Home Assistant

As respostas retornam para o mesmo dispositivo Alexa que iniciou a consulta, detectado automaticamente pelo recurso last_called do Home Assistant. O sistema usa Piper TTS no Home Assistant para saída de voz neural em espanhol nos alto-falantes Sonos e pode fornecer resumos matinais com dados de mercado, informações de calendário e métricas de negócios.

Ad

Stack Técnico

  • OpenClaw: Estrutura principal do agente de IA com suporte a Telegram, Alexa e interfaces de voz
  • Alexa Custom Skill: Proxy Node.js com autenticação por PIN e encadeamento de sessões
  • Ollama + Qwen 2.5 3B: LLM local que fornece respostas de ~0.5s
  • Home Assistant: Integra Alexa Media Player, Piper TTS e roteamento de dispositivos
  • Piper TTS: Voz neural em espanhol para alto-falantes Sonos

Detalhes Principais da Implementação

O desenvolvedor descobriu que usar um LLM local economiza aproximadamente 80% dos custos de API para perguntas simples que não exigem o Claude. No entanto, eles observaram que os modelos locais "alucinam livremente" e adicionaram um filtro de desvio para consultas de negócios e finanças.

O reconhecimento de fala da Alexa foi identificado como o gargalo, com AMAZON.SearchQuery e múltiplas amostras de enunciados ajudando a melhorar a precisão. A autenticação usa userId em vez de sessionId, pois a Alexa gera novas sessões para cada invocação. O desenvolvedor persiste a autenticação em arquivo porque os Maps na memória não sobrevivem a reinicializações do proxy.

O código do proxy está disponível como código aberto: openclaw-alexa-voice. Planos futuros incluem detecção de palavra de ativação ("Hey Lucy"), controle de casa inteligente e roteamento de alto-falantes baseado em presença.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Coordenação de Múltiplos Agentes de IA: Discord, Tarefas Agendadas e Hierarquia Clara
Use Cases

Coordenação de Múltiplos Agentes de IA: Discord, Tarefas Agendadas e Hierarquia Clara

Um desenvolvedor executando três agentes OpenClaw resolveu problemas de coordenação usando o Discord como canal de comunicação compartilhado, substituindo o caro sistema de heartbeat do Paperclip por cron jobs por agente e estabelecendo uma hierarquia clara de liderança entre os modelos Claude Max e OpenAI.

OpenClawRadar
Reduzindo os Custos de Agentes de IA em 30% por Meio de Monitoramento de Comportamento e Alterações de Configuração
Use Cases

Reduzindo os Custos de Agentes de IA em 30% por Meio de Monitoramento de Comportamento e Alterações de Configuração

Um desenvolvedor reduziu o uso de tokens do seu bot OpenClaw em 30% após descobrir que 70 tarefas cron estavam despejando resultados na sessão principal do chat, causando inchaço de contexto e compactação repetida. A solução envolveu redirecionar as saídas das tarefas cron diretamente para o Telegram e criar uma habilidade de monitoramento para identificar ineficiências como pesquisas redundantes e leituras de arquivos excessivamente grandes.

OpenClawRadar
Fluxo de Trabalho de Prospecção e Engajamento no LinkedIn Criado com Claude
Use Cases

Fluxo de Trabalho de Prospecção e Engajamento no LinkedIn Criado com Claude

Um desenvolvedor criou um fluxo de trabalho de prospecção no LinkedIn usando o Claude que identifica prospects relevantes, categoriza leads, encontra postagens recentes e gerencia o engajamento por meio de curtidas, comentários e solicitações de conexão. O sistema prioriza perfis com maior engajamento e ignora os inativos.

OpenClawRadar
Usando LLM Local para Monitorar Sessões AFK de Bot no Minecraft
Use Cases

Usando LLM Local para Monitorar Sessões AFK de Bot no Minecraft

Um desenvolvedor utilizou um LLM local para monitorar seu bot do Minecraft executando Baritone para tarefas de mineração, configurando monitoramento de tela para receber alertas quando o bot morre ou se desconecta do servidor.

OpenClawRadar