TranscriptionSuite v1.1.2 добавляет модели WhisperX, NeMo и VibeVoice.

Выпуск TranscriptionSuite v1.1.2
TranscriptionSuite, полностью локальное и открытое приложение для транскрипции аудио, выпустило версию 1.1.2 с важными дополнениями функций на основе отзывов сообщества.
Ключевые обновления
Разработчик заменил предыдущую реализацию faster-whisper на WhisperX и добавил поддержку нескольких новых семейств моделей:
- WhisperX - включает диаризацию через PyAnnote
- Модели NeMo - поддержка моделей Parakeet и Canary с диаризацией через PyAnnote
- Модели VibeVoice - поддержка как основной модели, так и 4-битных квантованных версий со встроенной диаризацией
Новые функции
- Менеджер моделей - централизованное управление различными моделями транскрипции
- Режим параллельной обработки - одновременная транскрипция и диаризация
- Управление горячими клавишами - сочетания клавиш для улучшения рабочего процесса
- Вставка в позицию курсора - функция прямой вставки текста
- Конвейер записи 24 кГц - специально добавлен для полного использования возможностей моделей VibeVoice (модели Whisper и NeMo требуют 16 кГц)
Приложение теперь предоставляет три различных конвейера транскрипции, каждый с разными подходами к диаризации в зависимости от выбранного семейства моделей.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Когнитор: Локально-ориентированная агентная ОС с архитектурой PGE Trinity
Cognithor — это полностью локальная, автономная операционная система для агентов, разработанная за год в 16 этапов. Она использует архитектуру PGE Trinity (Планировщик → Контролёр → Исполнитель), включает более 11 609 тестов с покрытием 89% и поддерживает 16 провайдеров LLM, включая Ollama и LM Studio.

Ветка Career-Ops добавляет поиск вакансий на LinkedIn с использованием Apify.
Разработчик форкнул систему career-ops Claude Code и добавил поиск вакансий на LinkedIn с помощью Apify, устранив главное ограничение исходного проекта, который сканировал только заранее настроенные страницы карьеры компаний.

Krasis: гибридная среда выполнения для больших моделей MoE на CPU/GPU демонстрирует скорость предзаполнения 3,324 ток/с на RTX 5080
Krasis — это гибридная среда выполнения CPU/GPU, предназначенная для работы с большими моделями типа Mixture-of-Experts (MoE). Она обрабатывает предварительное заполнение на GPU, а декодирование — на CPU, достигая скорости 3324 токена/с на RTX 5080 с моделью Qwen3-Coder-Next 80B Q4. Для работы требуется примерно в 2,5 раза больше оперативной памяти, чем размер модели, что позволяет запускать модели, слишком большие для видеопамяти.

tmux-claude: Мониторинг экземпляров кода Claude в панелях Tmux
tmux-claude — это инструмент, который добавляет мониторинг в реальном времени для экземпляров Claude Code в сессиях tmux. Он предоставляет строку состояния, интерактивную панель управления, улучшенный переключатель окон и уведомления на рабочем столе, считывая локальные файлы сессий без использования API.