Офлайн-инструмент преобразования речи в текст для macOS с использованием локальной модели Whisper через MLX

Разработчик создал whisper-dictate, инструмент для macOS, который позволяет выполнять полностью автономное преобразование речи в текст с возможностью перевода в реальном времени. Инструмент использует Whisper от OpenAI, работающий локально через MLX на Apple Silicon, без передачи данных за пределы вашего устройства.
Как это работает
Рабочий процесс прост: зажмите клавишу fn, говорите и отпустите. Текст транскрибируется и вставляется прямо туда, где вы печатаете. Инструмент работает в Slack, VS Code, браузерах, почте и любых других текстовых полях. Всплывающая накладка "Listening..." обеспечивает визуальную обратную связь во время записи.
Технические детали
- Транскрипция занимает около 500 мс после того, как вы перестаёте говорить
- Использует Whisper, работающий локально через MLX на Apple Silicon
- Малая модель хорошо подходит для повседневного использования
- Модель large-v3-turbo обеспечивает почти идеальную точность
- 100% автономная работа — без аккаунтов, токенов или передачи данных с вашего устройства
Функция перевода
Whisper может переводить на лету без дополнительных моделей или API перевода. Перевод встроен в этап декодирования Whisper. Например, при разговоре на французском выводится английский текст. Вы устанавливаете выходной язык на английский, и он обрабатывает перевод нативно.
Установка и настройка
При запуске инструмент спрашивает, на каком языке вы будете говорить и какой язык хотите получить на выходе, что позволяет легко переключаться между чистой транскрипцией и переводом. Вся настройка не требует подключения к интернету после установки.
Доступность
Проект имеет открытый исходный код на GitHub, чтобы другие могли использовать и адаптировать его под свои рабочие процессы.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Сервер Nakkas MCP Создает Анимированные SVG из Описаний ИИ
Nakkas — это MCP-сервер, в котором искусственный интеллект создаёт полные анимированные SVG-конфигурации по описаниям, генерируя чистые анимированные SVG с фигурами, градиентами, анимациями и фильтрами. Он поддерживает параметрические кривые, 15 пресетов фильтров, CSS @keyframes и SMIL-анимации, и работает везде, где рендерится SVG.

Transloadit MCP Server подключает AI-агентов к конвейеру обработки медиа
Transloadit создал MCP-сервер, который подключает Claude и других ИИ-агентов к их конвейеру обработки медиа с 86 Роботами для обработки видео, аудио, изображений и документов. Настройка в Claude Code требует одной строки: npx -y @transloadit/mcp-server stdio с переменными окружения TRANSLOADIT_KEY и TRANSLOADIT_SECRET.

Бесплатный Волшебник переносит историю ChatGPT в проекты Claude — Ключевые уроки по лимитам токенов и RAG
Бесплатный инструмент без кода переносит экспорт ChatGPT в проекты Claude, показывая, что 26 МБ JSON достигает лимита токенов, а разбивка по темам — это решение. RAG от Claude читает только части больших файлов, поэтому лучше всего работают конкретные запросы.

Локальная панель управления отслеживает использование Claude Code с учетом затрат на токены, вызовов инструментов и аналитики сессий.
Разработчик создал локальную панель управления, которая считывает JSONL-файлы сессий Claude Code для визуализации использования токенов, примерных затрат, распределения вызовов инструментов и истории сессий. Инструмент работает полностью на вашем компьютере с использованием Express API и React-панели управления.