Creación de una aplicación local de voz a texto para macOS con Claude Code: Caso de estudio de Vext

Un desarrollador compartió su experiencia construyendo Vext, una aplicación nativa de voz a texto para macOS que funciona completamente en el dispositivo usando Whisper en el Apple Neural Engine. Sin nube, sin cuentas, sin suscripción. La aplicación utiliza un núcleo en Rust con interfaz de usuario en Swift/SwiftUI y Core ML para la inferencia, con Claude Code como socio principal de codificación.
Características Principales
- Mantén presionado un atajo de teclado en cualquier lugar → habla → suelta → el texto aparece en el cursor
- Transcribe 60 segundos de audio en ~400ms (150x tiempo real)
- Limpieza inteligente: elimina palabras de relleno, reestructura el discurso para mayor legibilidad
- Traducción en tiempo real a más de 99 idiomas
- Transcripción de reuniones con identificación de hablantes y resúmenes automáticos
- Grabación de pantalla durante las grabaciones de voz (adjunta capturas de pantalla automáticamente)
Aciertos de Claude Code
- Whisper en Apple Silicon: Ayudó a iterar sobre estrategias de cuantización, fragmentación de modelos y diseño de memoria para la conversión a Core ML para que se ejecute eficientemente en el Neural Engine.
- Arquitectura del sistema de atajos de teclado: Sugirió usar un CGEventTap con permisos de accesibilidad adecuados y ayudó a depurar condiciones de carrera entre el inicio/parada de la grabación y la inyección en el portapapeles.
- FFI entre Rust y Swift: Generó enlaces FFI y detectó varios problemas de seguridad de memoria en la capa de interfaz C.
Limitaciones de Claude Code
- Tuvo dificultades con detalles específicos de la API de macOS que no están bien documentados en línea; los casos extremos de CGEventTap requirieron investigar directamente los encabezados de Apple.
- La ventana de contexto se convirtió en un cuello de botella en toda la base de código de Rust y Swift; el desarrollador dividió el proyecto en módulos y trabajó en uno a la vez.
Precios
Gratis para descargar y probar en getvext.app. $49 único para conservarlo (sin suscripción). Código VEXT50 para 50% de descuento.
📖 Leer la fuente original: r/ClaudeAI
👀 Ver también

ddash: Herramienta de Diagramas Mermaid con Almacenamiento Basado en URL e Integración de Código Claude
ddash es una herramienta gratuita de diagramas Mermaid donde todo el diagrama se comprime en el hash de la URL, sin necesidad de backend, cuentas o almacenamiento. Incluye una habilidad de Claude Code que te permite generar y abrir diagramas directamente durante conversaciones con comandos como /diagram the auth flow.

Sistema de 2 Prompts para Mantener el Contexto entre Conversaciones de Claude sin Desperdicio de Tokens
Un desarrollador comparte dos indicaciones para comprimir toda una conversación de Claude en un bloque de contexto estructurado y cargarlo en un nuevo chat, preservando decisiones, trabajo y próximos pasos.

context-os: Herramienta de código abierto reduce el consumo de tokens de Claude Code en un 27-42%
context-os es un optimizador de contexto local que se conecta automáticamente a Claude Code, comprimiendo la salida de las herramientas antes de que Claude la vea y reduciendo el consumo de tokens entre un 27% y un 42% según el tipo de contenido.

BottyFans: API abierta para monetizacion de agentes IA con USDC
Una nueva plataforma permite a los agentes de IA gestionar su propio negocio de creador con suscripciones, propinas y contenido pago en USDC.