TranscriptionSuite v1.1.2 fügt WhisperX-, NeMo- und VibeVoice-Modelle hinzu.

✍️ OpenClawRadar📅 Veröffentlicht: 17. April 2026🔗 Source
TranscriptionSuite v1.1.2 fügt WhisperX-, NeMo- und VibeVoice-Modelle hinzu.
Ad

TranscriptionSuite v1.1.2 Veröffentlichung

TranscriptionSuite, eine vollständig lokale und quelloffene Audio-Transkriptionsanwendung, hat Version 1.1.2 mit bedeutenden Funktionserweiterungen basierend auf Community-Feedback veröffentlicht.

Wichtige Aktualisierungen

Der Entwickler ersetzte die vorherige faster-whisper-Implementierung durch WhisperX und fügte Unterstützung für mehrere neue Modellfamilien hinzu:

  • WhisperX - Enthält Diarisierung über PyAnnote
  • NeMo-Modelle - Unterstützung für Parakeet- und Canary-Modelle mit Diarisierung über PyAnnote
  • VibeVoice-Modelle - Unterstützung für Hauptmodell und 4-Bit-quantisierte Versionen mit integrierter Diarisierung
Ad

Neue Funktionen

  • Modell-Manager - Zentrale Steuerung zur Verwaltung verschiedener Transkriptionsmodelle
  • Paralleler Verarbeitungsmodus - Gleichzeitige Transkription und Diarisierung
  • Tastenkürzel-Steuerungen - Tastenkombinationen für verbesserte Arbeitsabläufe
  • Einfügen an Cursorposition - Direkte Texteinfügefunktion
  • 24kHz-Aufnahmepipeline - Speziell hinzugefügt, um die Vorteile von VibeVoice-Modellen voll auszuschöpfen (Whisper- und NeMo-Modelle benötigen 16kHz)

Die Anwendung bietet nun drei verschiedene Transkriptions-Pipelines, jeweils mit unterschiedlichen Diarisierungsansätzen je nach ausgewählter Modellfamilie.

📖 Quelle vollständig lesen: r/LocalLLaMA

Ad

👀 Siehe auch

Spectral: Erfassen Sie App-Traffic, um MCP-Server für OpenClaw-Agenten zu generieren
Werkzeuge

Spectral: Erfassen Sie App-Traffic, um MCP-Server für OpenClaw-Agenten zu generieren

Spectral ist ein Open-Source-Tool, das den Datenverkehr von jeder Anwendung erfasst, ihn mit einem LLM analysiert und einen funktionierenden MCP-Server generiert, wodurch OpenClaw-Agenten die echte API der App direkt aufrufen können, anstatt sich auf Browser-Automatisierung zu verlassen.

OpenClawRadar
Koordinator-Server für Multi-Agenten-Entwicklung verhindert Überschreibungen
Werkzeuge

Koordinator-Server für Multi-Agenten-Entwicklung verhindert Überschreibungen

Ein Entwickler hat einen Node.js-Koordinatorserver erstellt, der Bereichssperren für Codezeilen, Zeilenverschiebungsverfolgung und Echtzeitnachrichten zwischen KI-Agenten verwaltet, die an derselben Codebasis arbeiten. Das System verhindert, dass Agenten die Arbeit des anderen überschreiben, indem es HTTP-basierte Sperren mit Konflikterkennung verwendet.

OpenClawRadar
Sammlung von 177 OpenClaw SOUL.md-Vorlagen, organisiert in 24 Kategorien
Werkzeuge

Sammlung von 177 OpenClaw SOUL.md-Vorlagen, organisiert in 24 Kategorien

Ein Entwickler hat 177 sofort einsatzbereite SOUL.md-Vorlagen für OpenClaw-Agenten in 24 Kategorien zusammengestellt, darunter Marketing, Entwicklung, Business, DevOps, Finanzen, Kreatives, Daten, Sicherheit, Gesundheit, Recht, Personalwesen und Bildung. Alle Vorlagen sind unter der MIT-Lizenz verfügbar und auf GitHub zu finden.

OpenClawRadar
Sx: Ein Open-Source-Paketmanager für KI-Fähigkeiten, MCPs und Befehle
Werkzeuge

Sx: Ein Open-Source-Paketmanager für KI-Fähigkeiten, MCPs und Befehle

Sx ist ein privater, npm-ähnlicher Paketmanager für KI-Assets – Skills, MCP-Konfigurationen, Befehle, Hooks und Agenten – der es Teams ermöglicht, KI-Konfigurationen über beliebige KI-Clients (Claude Code, Cursor, Copilot, Gemini) hinweg zu teilen, versionieren und beschränken.

OpenClawRadar