OpenClaw Alexa Voice Proxy Permite Interação de Voz Bidirecional

✍️ OpenClawRadar📅 Publicado: March 2, 2026🔗 Source
OpenClaw Alexa Voice Proxy Permite Interação de Voz Bidirecional
Ad

openclaw-alexa-voice é um proxy Node.js que conecta uma Alexa Custom Skill ao gateway OpenClaw, permitindo interação por voz com acesso completo a ferramentas como e-mail, calendário e finanças. O sistema implementa uma arquitetura de resposta de três níveis para lidar com diferentes tipos de consultas de forma eficiente.

Sistema de Resposta de Três Níveis

O proxy categoriza as respostas em três caminhos com base na complexidade e no tempo de processamento:

  • Caminho rápido (<1s) – Lida com consultas simples como hora, data e APIs personalizadas
  • Caminho do agente (<12s) – Fornece respostas rápidas da memória de IA
  • Caminho adiado (<2min) – Processa consultas complexas de forma assíncrona e depois reproduz via TTS do Home Assistant em qualquer alto-falante

Como Funciona

Quando uma consulta requer acesso a ferramentas (e-mail, busca na web, dados de mercado), a Alexa responde com "Deixe-me verificar" e encerra a sessão. O proxy então envia a consulta para a sessão principal do OpenClaw com acesso completo às ferramentas, aguarda até 2 minutos, remove a formatação markdown e reproduz a resposta em qualquer dispositivo Echo ou Sonos via integração Alexa Media Player do Home Assistant.

Ad

Principais Recursos

  • Autenticação por PIN de voz com sessões de 1 hora
  • Roteamento TTS multi-alto-falante para qualquer Echo, Sonos ou grupo de alto-falantes
  • Sistema de resposta rápida extensível para APIs personalizadas
  • Fallback para Telegram se o TTS falhar
  • Validação de assinatura de solicitação da Alexa
  • Limitação de taxa e registro de auditoria
  • Vincula apenas ao localhost por segurança

Stack Técnico

A implementação usa Node.js para o proxy, uma Alexa Custom Skill para interface de voz, WebSocket do gateway OpenClaw para comunicação e Home Assistant para reprodução TTS. Essa abordagem permite que desenvolvedores estendam as capacidades de voz para suas instâncias OpenClaw enquanto mantêm a segurança através de vinculação local e autenticação.

O projeto foi inspirado pela Discussão #11154 e está disponível como código aberto para desenvolvedores que desejam adicionar interação por voz às suas configurações OpenClaw. O sistema de três níveis garante interações de voz responsivas enquanto ainda permite que consultas complexas aproveitem todas as capacidades das ferramentas do OpenClaw.

📖 Leia o código-fonte completo: r/openclaw

Ad

👀 See Also

O Plugin OpenClaw-Mem0 Adiciona Memória Persistente Fora da Janela de Contexto
Tools

O Plugin OpenClaw-Mem0 Adiciona Memória Persistente Fora da Janela de Contexto

O plugin openclaw-mem0 move o armazenamento de memória completamente para fora da janela de contexto do OpenClaw, evitando perdas por compactação ou reinicializações de sessão. Ele oferece recall e captura automáticos com opções de configuração tanto na nuvem quanto local.

OpenClawRadar
SkyClaw: Um Ambiente de Execução de Agentes Aberto Escrito em Rust
Tools

SkyClaw: Um Ambiente de Execução de Agentes Aberto Escrito em Rust

SkyClaw é um runtime de agente de código aberto escrito em Rust com 34 novos recursos distribuídos por 7 fases de desenvolvimento. Inclui checkpoint de tarefas, filas persistentes com suporte a SQLite, execução paralela de ferramentas e suporte a multi-tenancy.

OpenClawRadar
9 Blocos de Construção para Executar o Claude Code como um SO Persistente em 18 Negócios
Tools

9 Blocos de Construção para Executar o Claude Code como um SO Persistente em 18 Negócios

Um desenvolvedor executa 18 instâncias do Claude Code como um sistema operacional compartilhado com sincronização seletiva, estado movido para servidores MCP, verificação baseada em recibos e regras de carregamento automático. Detalha a arquitetura.

OpenClawRadar
Markdown como Protocolo para Interface de Agente com Execução em Fluxo Contínuo
Tools

Markdown como Protocolo para Interface de Agente com Execução em Fluxo Contínuo

Um protótipo usa Markdown como um protocolo unificado para agentes de IA transmitirem texto, código executável e dados em uma única resposta. Ele apresenta execução em streaming, onde o código é executado instrução por instrução conforme chega, e um primitivo mount() para criar interfaces React com fluxo de dados entre cliente, servidor e LLM.

OpenClawRadar