TranscriptionSuite v1.1.2 ajoute les modèles WhisperX, NeMo et VibeVoice.

Sortie de TranscriptionSuite v1.1.2
TranscriptionSuite, une application de transcription audio entièrement locale et open source, a publié la version 1.1.2 avec des ajouts de fonctionnalités significatifs basés sur les retours de la communauté.
Principales Mises à Jour
Le développeur a remplacé l'implémentation précédente de faster-whisper par WhisperX et a ajouté la prise en charge de plusieurs nouvelles familles de modèles :
- WhisperX - Inclut la diarisation via PyAnnote
- Modèles NeMo - Prise en charge des modèles Parakeet et Canary avec diarisation via PyAnnote
- Modèles VibeVoice - Prise en charge à la fois du modèle principal et des versions quantifiées 4 bits avec diarisation intégrée
Nouvelles Fonctionnalités
- Gestionnaire de modèles - Contrôle centralisé pour gérer différents modèles de transcription
- Mode de traitement parallèle - Transcription et diarisation simultanées
- Raccourcis de contrôle - Raccourcis clavier pour améliorer le flux de travail
- Coller au curseur - Fonctionnalité d'insertion directe de texte
- Pipeline d'enregistrement à 24 kHz - Spécifiquement ajouté pour tirer pleinement parti des modèles VibeVoice (les modèles Whisper et NeMo nécessitent 16 kHz)
L'application propose désormais trois pipelines de transcription distincts, chacun avec des approches de diarisation différentes selon la famille de modèles sélectionnée.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Serveur MCP indexe les bases de code dans un graphe de connaissances pour une réduction de 10x des jetons
Un nouveau serveur MCP appelé codebase-memory-mcp analyse les bases de code dans un graphe de connaissances persistant en utilisant tree-sitter, réduisant l'utilisation de jetons d'au moins 10 fois pour les requêtes structurelles. Testé sur 35 dépôts réels, il remplace l'exploration fichier par fichier par des requêtes de graphe.

Rukuzu : Porter une base de données de graphes en C++ de 200 000 lignes vers Rust avec des tests systématiques
Le projet Rukuzu décrit une méthodologie pour porter la base de données de graphes embarquée kuzu, écrite en C++ avec 200 000 lignes de code, vers Rust. Il utilise une commande personnalisée Claude Code pour maintenir simultanément les deux versions et vérifier la justesse via plus de 2 700 tests.

Recherche sémantique locale pour conversations IA avec fastembed et LanceDB
Un développeur a indexé localement 368 000 messages de conversation IA en utilisant fastembed pour les embeddings basés sur CPU et LanceDB comme base de données vectorielle serverless, obtenant une latence de recherche p50 de 12 ms sans clés API.

Traduction vers fr : Compétence Aventure Textuelle Claude v1.1.0 Ajoute des Arcs de Campagne et des PNJ Améliorés
La mise à jour v1.1.0 de la compétence d'aventure textuelle Claude introduit des arcs de campagne où la progression des personnages persiste à travers les aventures, des PNJ avec des statistiques et niveaux cachés, et des modules visuels/audio optionnels. Téléchargez text-adventure.zip depuis les versions GitHub pour l'utiliser avec Claude Desktop ou claude.ai.