ClawTalk iOS-App ermöglicht Sprach-Chat mit selbst-gehosteten OpenClaw-KI-Agenten

Native iOS-Sprachschnittstelle für OpenClaw
ClawTalk ist eine Open-Source-iOS-Anwendung, die sprachbasierte Interaktion mit selbst gehosteten OpenClaw-KI-Agenten ermöglicht. Die App bietet eine Push-to-Talk-Schnittstelle, über die Benutzer mit ihren Agenten sprechen und sowohl Text- als auch Sprachantworten erhalten können.
Wichtige technische Funktionen
- On-Device-Sprachverarbeitung: Die Spracherkennung läuft lokal mit WhisperKit und nutzt Apples Neural Engine, um Audiodaten auf dem Telefon zu behalten
- Echtzeit-Antwort-Streaming: Agentenantworten werden in Echtzeit gestreamt mit Unterstützung für Markdown-Rendering
- Mehrere TTS-Optionen: Antworten können mit ElevenLabs, OpenAI TTS oder Apples eingebauter Sprachsynthese zurückgesprochen werden
- Multi-Agenten-Unterstützung: Unterstützt separate Konversationen mit verschiedenen Agenten/Modellen über Multi-Agenten-Kanäle
- Tools-Dashboard: Enthält ein Dashboard für die Interaktion mit Agenteninterna
- Medienunterstützung: Unterstützt Bildanhänge in Konversationen
Implementierungsdetails
Die App ist vollständig Open Source unter der MIT-Lizenz und auf GitHub verfügbar. Sie wurde speziell für Benutzer entwickelt, die OpenClaw für ihre selbst gehosteten LLM-Setups verwenden, und bietet eine mobile Sprachschnittstelle als Ergänzung zu bestehenden textbasierten Interaktionen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

companion-capture: Tool speichert Claudes Codes flüchtige Sprechblasen
companion-capture ist ein Open-Source-Tool, das die Sprechblasen des Begleitcharakters von Claude Code erfasst, bevor sie im Terminal verschwinden. Es speichert Nachrichten in Markdown-Dateien und SQLite für die Suche und verwendet VT100-Bildschirmpuffer-Parsing, um Cursorpositionen zu verfolgen.

OpenClaw-Entwickler baut einheitliches Speichersystem für KI-Agenten
Ein Entwickler hat ein 15-Tool-Einheitsspeichersystem für OpenClaw-KI-Agenten gebaut, das strukturierte Fakten, Vektorsuche, Entitätsgraphen, Episodenzeitpläne, hierarchische Komprimierung und ereignisgesteuerte Koordination kombiniert. Das System läuft lokal ohne Cloud-Abhängigkeiten oder monatliche Gebühren.

Graphthulhu MCP Server verleiht KI-Agenten Wissensgraphen-Gedächtnis für Logseq/Obsidian
Graphthulhu ist ein Open-Source-MCP-Server, der KI-Agenten Lese- und Schreibzugriff auf Logseq- oder Obsidian-Vaults bietet und Erinnerungen als strukturierte Seiten mit Eigenschaften und Verknüpfungen anstelle von Vektoreinbettungen speichert. Nach einem Monat hat das System 404 Seiten mit 1.451 Querverweisen generiert.

Windows-System-Tray-Monitor für Claude-Code-Kontingent
Eine Windows-Systemtray-Anwendung, die die Claude Code-Nutzung mit einem farbcodierten Symbol überwacht, Kontingentdaten alle 5 Minuten über die Anthropic OAuth API automatisch aktualisiert und detaillierte Dashboards mit stündlichen, täglichen, wöchentlichen und monatlichen Nutzungsmustern bereitstellt.