Création d'une application macOS de transcription vocale locale avec Claude Code : Étude de cas Vext

Un développeur a partagé son expérience de création de Vext, une application macOS native de dictée vocale qui fonctionne entièrement sur l'appareil à l'aide de Whisper sur Apple Neural Engine. Pas de cloud, pas de comptes, pas d'abonnement. L'application utilise un noyau Rust avec une interface Swift/SwiftUI et Core ML pour l'inférence, avec Claude Code comme partenaire de codage principal.
Fonctionnalités clés
- Maintenez un raccourci clavier n'importe où → parlez → relâchez → le texte apparaît au curseur
- Transcrit 60 secondes d'audio en ~400 ms (150x temps réel)
- Nettoyage intelligent : supprime les mots de remplissage, restructure le discours pour une meilleure lisibilité
- Traduction en temps réel dans plus de 99 langues
- Transcription de réunions avec identification des intervenants + résumés automatiques
- Enregistrement d'écran pendant les enregistrements vocaux (captures d'écran automatiquement jointes)
Succès de Claude Code
- Whisper sur Apple Silicon : A aidé à itérer sur les stratégies de quantification, le découpage des modèles et la disposition mémoire pour la conversion Core ML afin de fonctionner efficacement sur le Neural Engine.
- Architecture du système de raccourcis : A suggéré d'utiliser un CGEventTap avec les autorisations d'accessibilité appropriées, et a aidé à déboguer les conditions de concurrence entre le démarrage/l'arrêt de l'enregistrement et l'injection dans le presse-papiers.
- FFI Rust ↔ Swift : A généré des liaisons FFI et détecté plusieurs problèmes de sécurité mémoire dans la couche d'interface C.
Limitations de Claude Code
- A eu du mal avec les nuances spécifiques à macOS mal documentées en ligne — les cas limites de CGEventTap ont nécessité de fouiller directement dans les en-têtes Apple.
- La fenêtre de contexte est devenue un goulot d'étranglement dans l'ensemble du codebase Rust + Swift ; le développeur a divisé le projet en modules et travaillé sur un à la fois.
Tarifs
Téléchargement et essai gratuits sur getvext.app. 49 $ en paiement unique pour le conserver (sans abonnement). Code VEXT50 pour 50 % de réduction.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Les modèles Qwen locaux réalisent l'automatisation des navigateurs grâce à une planification étape par étape et un DOM compact.
Un développeur a découvert que de petits LLM locaux comme Qwen 8B et 4B réussissent l'automatisation de navigateur grâce à une planification étape par étape plutôt que des plans multi-étapes prédéfinis, combinée à une représentation DOM sémantique compacte qui réduit l'utilisation de tokens de 50-100K+ à ~15K pour des flux complets.

Construire un langage de programmation avec Claude Code : l'expérience Cutlet
Ankur Sethi a construit un langage de programmation complet appelé Cutlet en utilisant Claude Code sur quatre semaines, l'IA générant chaque ligne de code pendant qu'il se concentrait sur les garde-fous et les tests. Le langage propose un typage dynamique, des opérations vectorisées et un REPL, fonctionnant sur macOS et Linux.

Surveillance du quota de code Claude dans la barre système Windows
Une application de la zone de notification Windows qui surveille l'utilisation de Claude Code avec une icône codée par couleur, actualise automatiquement les données de quota toutes les 5 minutes via l'API OAuth d'Anthropic, et fournit des tableaux de bord détaillés montrant les tendances d'utilisation horaires, quotidiennes, hebdomadaires et mensuelles.

L'inspecteur de session pour Claude Code offre une visibilité en temps réel sur les opérations des agents d'IA.
Vibeyard, un IDE de terminal open-source qui encapsule Claude Code, a ajouté une fonctionnalité d'Inspecteur de Session qui offre une visibilité en temps réel sur les sessions Claude Code avec suivi chronologique, décomposition des coûts, analyses d'outils et surveillance de la fenêtre contextuelle.