Herramienta de Voz a Texto sin Conexión para macOS Usando Whisper Local mediante MLX

✍️ OpenClawRadar📅 Publicado: 12 de marzo de 2026🔗 Source
Herramienta de Voz a Texto sin Conexión para macOS Usando Whisper Local mediante MLX
Ad

Un desarrollador ha creado whisper-dictate, una herramienta para macOS que permite transcripción de voz a texto completamente offline con capacidades de traducción en tiempo real. La herramienta utiliza Whisper de OpenAI ejecutándose localmente a través de MLX en Apple Silicon, sin que ningún dato abandone tu máquina.

Cómo Funciona

El flujo de trabajo es sencillo: mantén presionada la tecla fn, habla y suéltala. El texto se transcribe y se pega directamente donde estás escribiendo. La herramienta funciona en Slack, VS Code, navegadores, correo electrónico o cualquier otro campo de texto. Una superposición flotante "Escuchando..." proporciona retroalimentación visual durante la grabación.

Detalles Técnicos

  • La transcripción toma aproximadamente 500ms después de dejar de hablar
  • Utiliza Whisper ejecutándose localmente a través de MLX en Apple Silicon
  • El modelo pequeño es sólido para uso diario
  • El modelo large-v3-turbo proporciona precisión casi perfecta
  • Operación 100% offline - sin cuentas, tokens o datos que abandonen tu máquina
Ad

Función de Traducción

Whisper puede traducir sobre la marcha sin modelos adicionales o APIs de traducción. La traducción está integrada en el paso de decodificación de Whisper. Por ejemplo, hablar francés produce texto en inglés. Configuras el idioma de salida a inglés, y maneja la traducción de forma nativa.

Configuración

Al iniciar, la herramienta pregunta en qué idioma hablarás y qué idioma quieres como salida, permitiendo cambiar fácilmente entre transcripción pura y traducción. Toda la configuración no requiere conexión a internet una vez instalada.

Disponibilidad

El proyecto está publicado como código abierto en GitHub para que otros lo usen y adapten a sus flujos de trabajo.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Flujo de trabajo eficiente utilizando Claude Code: Planificación antes de la ejecución
Herramientas

Flujo de trabajo eficiente utilizando Claude Code: Planificación antes de la ejecución

Boris Tane aprovecha Claude Code con un enfoque estructurado de planificación, centrándose en la investigación y planificación detalladas para mantener el control sobre las decisiones arquitectónicas.

OpenClawRadar
FUTO Swipe: Modelos de escritura deslizando de código abierto igualan la precisión de las grandes tecnológicas
Herramientas

FUTO Swipe: Modelos de escritura deslizando de código abierto igualan la precisión de las grandes tecnológicas

FUTO lanza modelos de escritura por deslizamiento de código abierto y un conjunto de datos de 1 millón de gestos. Codificador (635K parámetros) + ContextLM (1.5M) + decodificador (304K) logran una tasa de fallo del ~4% en top-4. Totalmente offline en FUTO Keyboard.

OpenClawRadar
Vibeyard añade intercambio de sesiones P2P para Claude Code.
Herramientas

Vibeyard añade intercambio de sesiones P2P para Claude Code.

Vibeyard, un IDE de código abierto para Claude Code, ahora admite el intercambio de sesiones entre pares. Los usuarios pueden compartir sesiones de terminal en vivo con compañeros de equipo a través de conexiones WebRTC cifradas, con modos de acceso de solo lectura o lectura-escritura.

OpenClawRadar
Mengram añade memoria persistente a los agentes OpenClaw.
Herramientas

Mengram añade memoria persistente a los agentes OpenClaw.

Mengram es un sistema de memoria de código abierto que proporciona a los agentes OpenClaw memoria a largo plazo entre sesiones, resolviendo el problema de que los agentes olvidan todo cuando se reinician. Ofrece memoria episódica, de entidades y procedimental con archivado inteligente de hechos obsoletos.

OpenClawRadar