Construyendo un Asistente de Voz con OpenClaw, Alexa y un LLM Local

Un desarrollador compartió su implementación de un asistente de voz prioritario que utiliza OpenClaw como columna vertebral del agente de IA, integrado con Alexa para la interacción por voz y un LLM local para el manejo de consultas rentable.
Cómo Funciona
El sistema se activa diciendo "Alexa, abre Lucy" a una habilidad personalizada de Alexa. Las consultas se procesan a través de un sistema de enrutamiento de cuatro niveles:
- Ruta rápida (0ms): Maneja hora, fecha y respuestas predefinidas
- LLM local Ollama (<1s): Utiliza Qwen 2.5 3B para consultas de conocimiento general, ejecutándose en un Mac Mini con Apple Silicon
- Agente Claude (5-12s): Maneja contexto personal, memoria y razonamiento complejo
- Diferido + herramientas (hasta 2min): Gestiona correo electrónico, búsqueda web y consultas de base de datos a través de TTS de Home Assistant
Las respuestas regresan al mismo dispositivo Alexa que inició la consulta, detectado automáticamente mediante la función last_called de Home Assistant. El sistema utiliza Piper TTS en Home Assistant para salida de voz neuronal en español en altavoces Sonos y puede entregar resúmenes matutinos con datos de mercado, información de calendario y métricas empresariales.
Pila Técnica
- OpenClaw: Columna vertebral del agente de IA que soporta Telegram, Alexa e interfaces de voz
- Habilidad Personalizada de Alexa: Proxy Node.js con autenticación PIN y encadenamiento de sesiones
- Ollama + Qwen 2.5 3B: LLM local que proporciona respuestas de ~0.5s
- Home Assistant: Integra Alexa Media Player, Piper TTS y enrutamiento de dispositivos
- Piper TTS: Voz neuronal en español para altavoces Sonos
Detalles Clave de Implementación
El desarrollador descubrió que usar un LLM local ahorra aproximadamente el 80% de los costos de API para preguntas simples que no requieren Claude. Sin embargo, notó que los modelos locales "alucinan libremente" y agregaron un filtro de desvío para consultas empresariales y financieras.
El reconocimiento de voz de Alexa se identificó como el cuello de botella, con AMAZON.SearchQuery y múltiples expresiones de ejemplo ayudando a mejorar la precisión. La autenticación utiliza userId en lugar de sessionId ya que Alexa genera nuevas sesiones para cada invocación. El desarrollador persiste la autenticación en archivo porque los Mapas en memoria no sobreviven a los reinicios del proxy.
El código del proxy está disponible como código abierto: openclaw-alexa-voice. Los planes futuros incluyen detección de palabra de activación ("Hey Lucy"), control de hogar inteligente y enrutamiento de altavoces basado en presencia.
📖 Read the full source: r/openclaw
👀 Ver también

Administrador de IA Ambiental Utilizando Claude Haiku para Notificaciones Conscientes del Contexto
Un desarrollador construyó un sistema de IA ambiental usando Claude Haiku que entrega notificaciones contextuales de una sola línea basadas en tareas de Notion, calendario, biométricas y presencia en el escritorio, mostradas en una barra de pantalla táctil de Raspberry Pi.

OpenClaw en Synology NAS: Solicitudes de Medios de Telegram y Gestión de Contenedores
Un usuario informa sobre la ejecución de OpenClaw en un NAS Synology junto con contenedores de pila multimedia como Plex, Sonarr, Radarr y SABnzbd. Lo utiliza para solicitudes de películas basadas en Telegram y tareas automatizadas de solución de problemas del NAS.

OpenClaw ha superado el chat — Una interfaz de panel es la opción predeterminada faltante
Un usuario de Reddit describe cómo ejecutar OpenClaw a través de Telegram se vuelve problemático a medida que los flujos de trabajo se multiplican, y por qué un panel web (como el que ellos mismos construyeron) debería ser una interfaz de usuario enchufable estándar para herramientas de agentes.

Usando OpenClaw como Sistema de Monitoreo Financiero y Gestión de Documentos
Un usuario configuró OpenClaw con acceso de solo lectura a la API bancaria para monitorear transacciones, generar reportes, rastrear flujo de efectivo y gestionar el seguimiento de suscripciones. La configuración también incluye la recolección automatizada de facturas por WhatsApp y la organización de documentos en Google Drive y Excel.