Whisper Local sur macOS : Transcription Hors Ligne en 500ms avec MLX

Un développeur a créé whisper-dictate, un outil macOS qui permet une transcription voix-texte entièrement hors ligne avec des capacités de traduction en temps réel. L'outil utilise Whisper d'OpenAI fonctionnant localement via MLX sur Apple Silicon, sans que vos données ne quittent jamais votre machine.

Fonctionnement

Le flux de travail est simple : maintenez la touche fn, parlez, puis relâchez. Le texte est transcrit et collé directement là où vous tapez. L'outil fonctionne dans Slack, VS Code, les navigateurs, les e-mails ou tout autre champ de texte. Une superposition flottante "Écoute..." fournit un retour visuel pendant l'enregistrement.

Détails techniques

La transcription prend environ 500 ms après avoir arrêté de parler
Utilise Whisper fonctionnant localement via MLX sur Apple Silicon
Le petit modèle est solide pour un usage quotidien
Le modèle large-v3-turbo offre une précision quasi parfaite
Fonctionnement 100% hors ligne - aucun compte, jeton ou donnée ne quitte votre machine

Fonction de traduction

Whisper peut traduire à la volée sans modèles supplémentaires ni API de traduction. La traduction est intégrée à l'étape de décodage de Whisper. Par exemple, parler en français produit du texte en anglais. Vous définissez la langue de sortie sur l'anglais, et il gère la traduction nativement.

Installation et configuration

Au lancement, l'outil demande dans quelle langue vous allez parler et ce que vous voulez comme sortie, permettant de basculer facilement entre la transcription pure et la traduction. L'ensemble de l'installation ne nécessite aucune connexion Internet une fois installé.

Disponibilité

Le projet est open-source sur GitHub pour que d'autres puissent l'utiliser et l'adapter à leurs flux de travail.

📖 Read the full source: r/LocalLLaMA

Outil de Reconnaissance Vocale Hors Ligne pour macOS Utilisant Whisper Local via MLX

Fonctionnement

Détails techniques

Fonction de traduction

Installation et configuration

Disponibilité

👀 See Also

free-claude-code ajoute la prise en charge de GLM-5 via NVIDIA NIM, et s'étend à OpenRouter et Discord

LLM-Memory.net : Système de mémoire open-source avec infrastructure multi-agent

Heddle : Application de la confiance et journalisation des audits pour les connexions MCP de Claude Desktop

mindpm : Un serveur MCP gratuit pour une mémoire de projet persistante avec Claude