Parlez avec Claw : Interface Vocale iOS Open Source pour les Bots OpenClaw Telegram

Speak with Claw est une application iOS open source qui offre des capacités d'interface vocale pour les bots Telegram fonctionnant sur l'infrastructure OpenClaw. Le système permet une interaction conversationnelle où les utilisateurs parlent à leurs bots, l'audio est traité localement, et les réponses sont retournées à la fois sous forme de texte et d'audio.
Fonctionnement
L'application iOS capture la saisie vocale et envoie l'audio à un serveur relais fonctionnant sur un Mac. Ce serveur traite l'audio via le bot Telegram de l'utilisateur alimenté par OpenClaw, qui peut se connecter à n'importe quelle API LLM (Claude, GPT, Gemini, etc.). La réponse du bot est renvoyée à l'application iOS sous forme de texte et d'audio pour la lecture.
Fonctionnalités principales
- Mode conversation avec détection d'activité vocale (VAD) : Détecte automatiquement quand vous parlez sans nécessiter d'appui sur un bouton
- Activation par mot-clé : Peut être déclenché avec des phrases comme "Hey Bot"
- Lecture de réponse audio : Les bots peuvent répondre avec de l'audio synthétisé
- Accès à distance via Tailscale : Fonctionne de n'importe où tout en préservant la confidentialité
- Sélection de plusieurs bots : Prend en charge la commutation entre différents bots OpenClaw
Implémentation technique
Le système utilise une architecture en trois parties :
- Application iOS : Développée avec Swift, AVFoundation et SFSpeechRecognizer
- Serveur relais : Application Python/Flask avec Telethon pour l'intégration Telegram, fonctionne sur Mac
- Intégration OpenClaw : Se connecte à n'importe quel bot Telegram alimenté par OpenClaw
Performances et limites
Le développeur note qu'il ne s'agit pas d'un système instantané comme Siri. La latence dépend de la vitesse de traitement de votre LLM et des conditions réseau. L'application est décrite comme "certainement pas parfaite" et les utilisateurs doivent "l'utiliser à leurs propres risques".
Considérations de confidentialité
Tout le traitement des données se produit sur votre propre infrastructure. Aucune donnée utilisateur n'est envoyée au développeur de l'application. L'ensemble du système est auto-hébergé, préservant la confidentialité en gardant les interactions vocales dans votre environnement contrôlé.
Disponibilité
Le projet est open source sous licence MIT sans intérêt commercial. Le code source est disponible sur GitHub pour les développeurs qui souhaitent implémenter ou modifier le système pour leurs propres bots OpenClaw.
📖 Lire la source complète : r/openclaw
👀 See Also

Combler les angles morts d'OpenClaw : Créer un sitemap pour récupérer tous les blogs d'Anthropic
L'outil navigateur d'OpenClaw ne découvre pas tous les blogs d'Anthropic car ils sont hébergés sur plusieurs URL. Un utilisateur a résolu ce problème en fournissant un sitemap généré, puis a transformé la solution en compétence partageable.

Attesor : Rétro-ingénierie assistée par l'IA de Rosetta 2 pour machine virtuelle Linux
Attesor est un projet GitHub qui utilise l'IA pour rétro-concevoir la technologie de traduction binaire Rosetta 2 d'Apple, visant à documenter son architecture et potentiellement permettre la traduction x86_64 vers ARM64 sur des machines virtuelles Linux.
Serveur MCP Claude Garmin : Des données réelles de fitness pour des conseils d'entraînement plus intelligents
Un serveur MCP qui connecte Claude Desktop à Garmin Connect, exposant 8 outils (récupération, VRC, VO2max, etc.) pour des plans d'entraînement basés sur les données.

Claude IDE Bridge : Outil MCP pour l'accès à l'éditeur à distance
Claude IDE Bridge est un outil open-source qui fournit à Claude AI un accès de contrôle à distance aux éditeurs de code via MCP (Model Context Protocol). Il expose les connaissances de l'éditeur, telles que les informations de type en direct et l'état du débogueur, sous forme d'outils pouvant être appelés.