Aufbau eines Sprachassistenten mit OpenClaw, Alexa und lokalem LLM

✍️ OpenClawRadar📅 Veröffentlicht: 1. März 2026🔗 Source
Aufbau eines Sprachassistenten mit OpenClaw, Alexa und lokalem LLM
Ad

Ein Entwickler teilte seine Implementierung eines sprachgesteuerten Assistenten, der OpenClaw als KI-Agenten-Backbone nutzt, mit Alexa für Sprachinteraktion und einem lokalen LLM für kosteneffiziente Anfragebearbeitung integriert.

Wie es funktioniert

Das System wird durch den Befehl "Alexa, öffne Lucy" zu einer benutzerdefinierten Alexa-Fähigkeit aktiviert. Anfragen werden durch ein vierstufiges Routing-System verarbeitet:

  • Schnellpfad (0ms): Bearbeitet Zeit, Datum und fest codierte Antworten
  • Ollama lokales LLM (<1s): Nutzt Qwen 2.5 3B für allgemeine Wissensanfragen, läuft auf einem Mac Mini mit Apple Silicon
  • Claude-Agent (5-12s): Bearbeitet persönlichen Kontext, Erinnerung und komplexe Schlussfolgerungen
  • Verzögert + Werkzeuge (bis zu 2min): Verwaltet E-Mail, Websuche und Datenbankabfragen über Home Assistant TTS

Antworten kehren zum selben Alexa-Gerät zurück, das die Anfrage initiiert hat, automatisch erkannt über Home Assistants last_called-Funktion. Das System nutzt Piper TTS auf Home Assistant für neuronale spanische Sprachausgabe auf Sonos-Lautsprechern und kann Morgenbriefings mit Marktdaten, Kalenderinformationen und Geschäftskennzahlen liefern.

Ad

Technischer Stack

  • OpenClaw: KI-Agenten-Backbone mit Unterstützung für Telegram, Alexa und Sprachschnittstellen
  • Alexa Custom Skill: Node.js-Proxy mit PIN-Authentifizierung und Sitzungsverkettung
  • Ollama + Qwen 2.5 3B: Lokales LLM mit ~0,5s Antwortzeiten
  • Home Assistant: Integriert Alexa Media Player, Piper TTS und Geräte-Routing
  • Piper TTS: Neuronale spanische Stimme für Sonos-Lautsprecher

Wichtige Implementierungsdetails

Der Entwickler stellte fest, dass die Nutzung eines lokalen LLM etwa 80 % der API-Kosten für einfache Fragen einspart, die Claude nicht erfordern. Allerdings merkte er an, dass lokale Modelle "frei halluzinieren" und fügte einen Umgehungsfilter für Geschäfts- und Finanzanfragen hinzu.

Alexa-Spracherkennung wurde als Engpass identifiziert, wobei AMAZON.SearchQuery und mehrere Beispieläußerungen die Genauigkeit verbessern. Die Authentifizierung verwendet userId statt sessionId, da Alexa für jeden Aufruf neue Sitzungen generiert. Der Entwickler speichert Authentifizierung in einer Datei, da In-Memory-Maps Proxy-Neustarts nicht überstehen.

Der Proxy-Code ist als Open Source verfügbar: openclaw-alexa-voice. Zukünftige Pläne umfassen Wake-Word-Erkennung ("Hey Lucy"), Smart-Home-Steuerung und präsenzbasiertes Lautsprecher-Routing.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

Autonomes Magazin-Pipeline mit Claude Code: Agentische Architektur im Detail
Anwendungsfälle

Autonomes Magazin-Pipeline mit Claude Code: Agentische Architektur im Detail

Eine siebenstufige Pipeline, die Claude Code als Redaktionsteam nutzt, erstellt bis zu fünf faktengeprüfte, mehrsprachige Artikel pro Schlagzeile. Das System umfasst fünf Sub-Agenten, institutionelles Gedächtnis über Embeddings und automatisierte Faktenprüfung gegen eine wachsende Datenbank.

OpenClawRadar
Claude Managed Agents veröffentlicht: Multi-Agent-Orchestrierung und 70 Tage praktischer Erfahrungen
Anwendungsfälle

Claude Managed Agents veröffentlicht: Multi-Agent-Orchestrierung und 70 Tage praktischer Erfahrungen

Anthropic hat Managed Agents für Multi-Agenten-Orchestrierung und verbesserte Toolchains veröffentlicht. Ein Entwickler teilt 70 Tage Erfahrung mit rollengetrennten Agenten (Opus-Entscheidungsschicht, OpenCode-Ingenieur, Forschungsagenten) und den entscheidenden Wandel von ‚führe dies aus‘ zu ‚du kannst meine Prämisse hinterfragen‘.

OpenClawRadar
OpenClaw-Einrichtung für College-Baseball-Ergebnisaktualisierungen mit Telegram-Benachrichtigungen
Anwendungsfälle

OpenClaw-Einrichtung für College-Baseball-Ergebnisaktualisierungen mit Telegram-Benachrichtigungen

Ein Entwickler hat einen OpenClaw-Flow erstellt, der etwa alle 8 Minuten ASU- und GT-Baseballspiele über die ESPN-College-Baseball-Scoreboard-API prüft und Telegram-Benachrichtigungen nur bei Änderungen der Ergebnisse, Innings oder Endresultate sendet, um Spam zu vermeiden.

OpenClawRadar
Entwickler kombiniert Claude Code und Codex für besseren KI-Codierungs-Workflow
Anwendungsfälle

Entwickler kombiniert Claude Code und Codex für besseren KI-Codierungs-Workflow

Ein Entwickler berichtet, dass er Claude Code als Orchestrator und Codex als Worker einsetzt und feststellt, dass die schnellere Codiergeschwindigkeit von Codex mit GPT 5.4 durch schlechte Erklärungen ausgeglichen wird, die mehrfaches Lesen erfordern, um zu verstehen, was sich geändert hat.

OpenClawRadar