TranscriptionSuite v1.1.2 agrega los modelos WhisperX, NeMo y VibeVoice.

Lanzamiento de TranscriptionSuite v1.1.2
TranscriptionSuite, una aplicación de transcripción de audio completamente local y de código abierto, ha lanzado la versión 1.1.2 con importantes adiciones de funciones basadas en los comentarios de la comunidad.
Actualizaciones Clave
El desarrollador reemplazó la implementación anterior de faster-whisper con WhisperX y agregó soporte para múltiples nuevas familias de modelos:
- WhisperX - Incluye diarización a través de PyAnnote
- Modelos NeMo - Soporte para modelos Parakeet y Canary con diarización a través de PyAnnote
- Modelos VibeVoice - Soporte tanto para el modelo principal como para versiones cuantizadas de 4 bits con diarización incorporada
Nuevas Funciones
- Gestor de Modelos - Control centralizado para gestionar diferentes modelos de transcripción
- Modo de procesamiento paralelo - Transcripción y diarización simultáneas
- Controles de acceso directo - Atajos de teclado para mejorar el flujo de trabajo
- Pegar en el cursor - Funcionalidad de inserción directa de texto
- Flujo de grabación de 24kHz - Específicamente añadido para aprovechar al máximo los modelos VibeVoice (los modelos Whisper y NeMo requieren 16kHz)
La aplicación ahora proporciona tres flujos de transcripción distintos, cada uno con diferentes enfoques de diarización dependiendo de la familia de modelos seleccionada.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Cómo Mover o Renombrar Carpetas de Proyectos de Código Claude Sin Perder el Historial de Sesión
Claude Code almacena el historial de sesiones utilizando rutas de proyecto absolutas, por lo que mover o renombrar carpetas con mv interrumpe el acceso a las sesiones. La herramienta clamp soluciona esto migrando los datos de sesión para que coincidan con las nuevas rutas.
Integración de TTS de xAI para Home Assistant construida con Claude — Repositorio completo
Un desarrollador usó Claude para construir una integración personalizada de Home Assistant para la API de TTS de xAI (voz Eve) con configuración completa desde la interfaz, cinco voces y etiquetas de expresión.

Habilidad de Lanzamiento de Productos Claude AI: Guías Estructuradas para Lanzamientos de Productos de IA
Una habilidad gratuita de Claude proporciona seis manuales de lanzamiento probados en batalla que cubren estrategia, preparación, mensajería y ejecución de canales para lanzamientos de productos de IA. El repositorio incluye materiales en inglés y chino organizados por etapa de lanzamiento.

Anamnesis: Un Sistema de Memoria Personal para Claude a través de MCP
Anamnese es una herramienta gratuita que almacena contexto personal—hechos, proyectos, metas, tareas—y se conecta a Claude mediante MCP, permitiendo que la IA acceda a esta información al inicio de cada conversación.