TranscriptionSuite v1.1.2 adiciona os modelos WhisperX, NeMo e VibeVoice.

Lançamento do TranscriptionSuite v1.1.2
O TranscriptionSuite, um aplicativo de transcrição de áudio totalmente local e de código aberto, lançou a versão 1.1.2 com adições significativas de recursos baseadas no feedback da comunidade.
Principais Atualizações
O desenvolvedor substituiu a implementação anterior do faster-whisper pelo WhisperX e adicionou suporte para várias novas famílias de modelos:
- WhisperX - Inclui diarização via PyAnnote
- Modelos NeMo - Suporte para modelos Parakeet e Canary com diarização via PyAnnote
- Modelos VibeVoice - Suporte para o modelo principal e versões quantizadas de 4 bits com diarização integrada
Novos Recursos
- Gerenciador de Modelos - Controle centralizado para gerenciar diferentes modelos de transcrição
- Modo de processamento paralelo - Transcrição e diarização simultâneas
- Controles de atalho - Atalhos de teclado para melhorar o fluxo de trabalho
- Colar no cursor - Funcionalidade de inserção direta de texto
- Pipeline de gravação de 24kHz - Adicionado especificamente para aproveitar ao máximo os modelos VibeVoice (os modelos Whisper e NeMo requerem 16kHz)
O aplicativo agora fornece três pipelines de transcrição distintos, cada um com diferentes abordagens de diarização dependendo da família de modelos selecionada.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Servidor MCP de Nutrição Construído com Claude Code para Exportação de Diário Alimentar
Um desenvolvedor criou um servidor MCP de nutrição usando Claude Code após aplicativos comerciais bloquearem a exportação de dados, criando uma ferramenta que registra refeições via Claude, gera resumos e exporta para Excel sem precisar trocar de aplicativos.

Problemas de Compromisso: Uma Ferramenta que Analisa e 'Enterra' Repositórios Inacabados do GitHub
Um desenvolvedor criou uma ferramenta chamada Commitment Issues que analisa repositórios do GitHub para determinar se foram abandonados, gera um 'certificado de óbito' e extrai a mensagem do último commit como 'últimas palavras'. A ferramenta usa heurísticas como frequência de commits, última atividade e estrelas versus momentum, e foi prototipada usando Claude.

Canopy: Painel de Terminal para Gerenciar Múltiplos Agentes de Código Claude
Canopy é uma interface de usuário de terminal de código aberto que fornece uma visão única de painel para rastrear múltiplos agentes de codificação de IA em execução em worktrees do git. Ele mostra os estados dos agentes (executando, ocioso, aguardando entrada, concluído, com erro) e permite que você entre nas sessões ou envie entrada sem alternar completamente.

AnyClaw: Ubuntu 24.04 com acesso ao hardware Android e agente de IA para desenvolvimento no terminal
O AnyClaw oferece um ambiente Ubuntu 24.04 completo rodando em proot no Android com acesso direto às APIs de hardware do Android a partir do terminal, incluindo câmera, GPS, bateria e sensores via comandos bash e execução Java. Ele inclui um agente de programação de IA que pode orquestrar essas ferramentas e uma interface web acessível de qualquer navegador na mesma rede.