Создание локального приложения для преобразования речи в текст на macOS с помощью Claude Code: пример Vext

Разработчик поделился опытом создания Vext — нативного приложения для macOS, преобразующего голос в текст полностью на устройстве с помощью Whisper на Apple Neural Engine. Никаких облаков, аккаунтов или подписок. Приложение использует ядро на Rust с UI на Swift/SwiftUI и Core ML для инференса, а Claude Code выступал в роли основного помощника по коду.
Ключевые возможности
- Зажмите горячую клавишу в любом приложении → говорите → отпустите → текст появится у курсора
- Транскрибирует 60 секунд аудио за ~400 мс (в 150 раз быстрее реального времени)
- Умная очистка: удаляет слова-паразиты, структурирует речь для удобства чтения
- Перевод в реальном времени на 99+ языков
- Транскрибация встреч с диаризацией дикторов + автосуммирование
- Запись экрана во время голосовой записи (автоматически прикрепляет скриншоты)
Успехи с Claude Code
- Whisper на Apple Silicon: Помог итеративно подбирать стратегии квантизации, разбиения модели и компоновки памяти для конвертации в Core ML для эффективной работы на Neural Engine.
- Архитектура системы горячих клавиш: Предложил использовать CGEventTap с правильными правами доступности и помог отладить состояния гонки между запуском/остановкой записи и вставкой в буфер обмена.
- Rust ↔ Swift FFI: Сгенерировал FFI-привязки и выявил несколько проблем с безопасностью памяти в слое C-интерфейса.
Ограничения Claude Code
- С трудом справлялся с нюансами macOS-specific API, которые плохо задокументированы онлайн — для обработки граничных случаев CGEventTap пришлось напрямую изучать заголовочные файлы Apple.
- Окно контекста стало узким местом при работе с полной кодовой базой Rust + Swift; разработчик разделил проект на модули и работал над каждым по отдельности.
Цены
Бесплатно для загрузки и тестирования на getvext.app. Единоразовый платёж $49 за полную версию (без подписки). Промокод VEXT50 даёт скидку 50%.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Инструмент Claude-context-lint анализирует избыточное использование токенов в проектах Claude Code.
Новый инструмент claude-context-lint анализирует проекты Claude Code, чтобы показать, сколько контекстного окна потребляется файлами CLAUDE.md, навыками, серверами MCP и системными промптами до ввода пользователя. Инструмент предоставляет конкретные рекомендации по сокращению использования токенов.

Statespace: Создавайте интерактивные веб-приложения для агентов OpenClaw с помощью Markdown
Statespace — это бесплатный, открытый фреймворк для создания и обмена веб-приложениями, совместимыми с ИИ, которыми агенты OpenClaw могут управлять и взаимодействовать с ними, используя чистый Markdown. Он позволяет определять инструменты, компоненты и инструкции в Markdown-файлах, к которым агенты получают доступ через HTTP.

Бенчмарк: MLX vs Ollama, запуск Qwen3-Coder-Next 8-Bit на MacBook Pro M5 Max
Бенчмарк, сравнивающий бэкенды MLX и Ollama, работающие с квантованной 8-битной версией Qwen3-Coder-Next на MacBook Pro M5 Max с 128 ГБ оперативной памяти, показал, что MLX достигает примерно 72 токенов в секунду, что примерно вдвое превышает пропускную способность Ollama в различных задачах программирования.

OpenClaw: Революция в обслуживании веб-сайтов с помощью постоянного мониторинга
OpenClaw, инновационное агентство на базе ИИ, переосмысляет обслуживание веб-сайтов, работая без усталости круглосуточно. Используя передовую автоматизацию, оно обеспечивает оптимальную работу веб-сайта и быстро решает проблемы.