Création d'une Interface Vocale pour les Agents OpenClaw via les Raccourcis iPhone

Un développeur sur r/openclaw a partagé sa configuration pour créer une interface vocale similaire à Siri pour les agents OpenClaw. Le système combine un serveur Python local avec des Raccourcis iPhone pour permettre une interaction vocale avec les agents OpenClaw.
Architecture du système
La configuration nécessite d'activer le mode HTTP OpenAI sur la passerelle et le réseau local OpenClaw. Les composants principaux sont :
- Serveur Python : À l'origine un script qui écoutait les mots-clés via le microphone, effectuait la reconnaissance vocale, envoyait le texte à l'API OpenClaw, recevait les réponses et effectuait la synthèse vocale en utilisant la voix de l'utilisateur. Cela a été adapté en un serveur basique avec un point de terminaison qui peut recevoir du texte de n'importe où, l'envoyer à OpenClaw et renvoyer la réponse.
- Raccourci iPhone : Gère la reconnaissance vocale et la synthèse vocale localement sur l'iPhone. Le flux de travail du raccourci comprend :
- Dicter du texte (enregistre la voix en texte)
- Obtenir le contenu de l'URL : url/ask avec le texte dicté dans le corps (envoie le texte pour être acheminé vers l'agent OpenClaw pour une réponse)
- Dictionnaire : Obtenir la valeur de la réponse dans le contenu de l'URL (stocker le texte de réponse)
- Parler : valeur du dictionnaire (sortie de synthèse vocale)
Détails d'implémentation
Le développeur exécute cela via WireGuard et fonctionne entièrement sur le réseau local ou via VPN lorsqu'il est en dehors du réseau local. Il souligne une considération de sécurité critique : "Soyez prudent en ouvrant un point de terminaison pour que votre agent OpenClaw réponde. Cela peut permettre à n'importe qui d'accéder à votre agent (ordinateur). Utilisez un jeton d'authentification."
Cette approche délègue le traitement vocal à l'iPhone tout en maintenant l'interaction avec l'agent OpenClaw centralisée via le point de terminaison du serveur Python. Cela permet une interaction vocale avec les agents OpenClaw depuis n'importe où tout en maintenant la sécurité via VPN et les jetons d'authentification.
📖 Read the full source: r/openclaw
👀 See Also

Plateforme de jeux de rôle B2B utilise Opus 4.7 pour le backend, Haiku 4.5 pour le chat en direct
Socratize (socratize.io) utilise Opus 4.7 pour l'orchestration et l'évaluation des gains/pertes, et Haiku 4.5 pour le chat en temps réel grâce à une meilleur amabilité et un coût réduit.

Migration d'OpenClaw vers Cowork + Claude Code : L'expérience d'un développeur
Un développeur a migré d'OpenClaw vers Cowork d'Anthropic avec les sessions Claude Code, citant de meilleurs cron jobs, un routage par dispatch et une mémoire persistante. La configuration utilise une conception de contexte à trois couches, Cowork gérant l'orchestration et Claude Code exécutant le code dans les dépôts.

Ingestion directe de documents mobiles vers OpenClaw : Flux de travail santé iOS vers Raspberry Pi
Un développeur partage une architecture permettant d'envoyer directement des documents depuis un client mobile iOS vers une instance locale d'OpenClaw sur un Raspberry Pi, en utilisant un appairage par QR code et des points de terminaison dédiés pour le traitement des dossiers de santé.

Création de Drivesidekick : Une application de conduite avec Claude Code
Les développeurs utilisent Claude Code pour créer des applications mobiles sans expertise en développement front-end. Un développeur backend a utilisé Claude Code pour créer Drivesidekick, une application de leçons de conduite utilisant React Native/Expo.