TranscriptionSuite v1.1.2 добавляет модели WhisperX, NeMo и VibeVoice.

✍️ OpenClawRadar📅 Опубликовано: 17 апреля 2026 г.🔗 Source
TranscriptionSuite v1.1.2 добавляет модели WhisperX, NeMo и VibeVoice.
Ad

Выпуск TranscriptionSuite v1.1.2

TranscriptionSuite, полностью локальное и открытое приложение для транскрипции аудио, выпустило версию 1.1.2 с важными дополнениями функций на основе отзывов сообщества.

Ключевые обновления

Разработчик заменил предыдущую реализацию faster-whisper на WhisperX и добавил поддержку нескольких новых семейств моделей:

  • WhisperX - включает диаризацию через PyAnnote
  • Модели NeMo - поддержка моделей Parakeet и Canary с диаризацией через PyAnnote
  • Модели VibeVoice - поддержка как основной модели, так и 4-битных квантованных версий со встроенной диаризацией
Ad

Новые функции

  • Менеджер моделей - централизованное управление различными моделями транскрипции
  • Режим параллельной обработки - одновременная транскрипция и диаризация
  • Управление горячими клавишами - сочетания клавиш для улучшения рабочего процесса
  • Вставка в позицию курсора - функция прямой вставки текста
  • Конвейер записи 24 кГц - специально добавлен для полного использования возможностей моделей VibeVoice (модели Whisper и NeMo требуют 16 кГц)

Приложение теперь предоставляет три различных конвейера транскрипции, каждый с разными подходами к диаризации в зависимости от выбранного семейства моделей.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Когнитор: Локально-ориентированная агентная ОС с архитектурой PGE Trinity
Инструменты

Когнитор: Локально-ориентированная агентная ОС с архитектурой PGE Trinity

Cognithor — это полностью локальная, автономная операционная система для агентов, разработанная за год в 16 этапов. Она использует архитектуру PGE Trinity (Планировщик → Контролёр → Исполнитель), включает более 11 609 тестов с покрытием 89% и поддерживает 16 провайдеров LLM, включая Ollama и LM Studio.

OpenClawRadar
Ветка Career-Ops добавляет поиск вакансий на LinkedIn с использованием Apify.
Инструменты

Ветка Career-Ops добавляет поиск вакансий на LinkedIn с использованием Apify.

Разработчик форкнул систему career-ops Claude Code и добавил поиск вакансий на LinkedIn с помощью Apify, устранив главное ограничение исходного проекта, который сканировал только заранее настроенные страницы карьеры компаний.

OpenClawRadar
Krasis: гибридная среда выполнения для больших моделей MoE на CPU/GPU демонстрирует скорость предзаполнения 3,324 ток/с на RTX 5080
Инструменты

Krasis: гибридная среда выполнения для больших моделей MoE на CPU/GPU демонстрирует скорость предзаполнения 3,324 ток/с на RTX 5080

Krasis — это гибридная среда выполнения CPU/GPU, предназначенная для работы с большими моделями типа Mixture-of-Experts (MoE). Она обрабатывает предварительное заполнение на GPU, а декодирование — на CPU, достигая скорости 3324 токена/с на RTX 5080 с моделью Qwen3-Coder-Next 80B Q4. Для работы требуется примерно в 2,5 раза больше оперативной памяти, чем размер модели, что позволяет запускать модели, слишком большие для видеопамяти.

OpenClawRadar
tmux-claude: Мониторинг экземпляров кода Claude в панелях Tmux
Инструменты

tmux-claude: Мониторинг экземпляров кода Claude в панелях Tmux

tmux-claude — это инструмент, который добавляет мониторинг в реальном времени для экземпляров Claude Code в сессиях tmux. Он предоставляет строку состояния, интерактивную панель управления, улучшенный переключатель окон и уведомления на рабочем столе, считывая локальные файлы сессий без использования API.

OpenClawRadar