Echo-TTS портирован на Apple Silicon с использованием MLX для нативного TTS с клонированием голоса

✍️ OpenClawRadar📅 Опубликовано: 7 марта 2026 г.🔗 Source
Echo-TTS портирован на Apple Silicon с использованием MLX для нативного TTS с клонированием голоса
Ad

Echo-TTS, 2.4-миллиардная диффузионная трансформерная (DiT) модель преобразования текста в речь с клонированием голоса, была портирована с CUDA для нативной работы на Apple M-серии с использованием MLX. Порт позволяет модели генерировать речь с целевым голосом при вводе текста и короткого аудиоклипа с речью человека.

Производительность и тесты

На базовом 16 ГБ Mac mini M4 модель генерирует короткий 5-секундный клон голоса примерно за 10 секунд. Клоны длительностью до 30 секунд создаются приблизительно за 60 секунд.

Ключевые особенности

  • 8-битная квантизация: Снижает использование памяти с примерно 6 ГБ до около 4 ГБ, работает быстрее с незначительной потерей качества.
  • Блочная генерация: Обеспечивает потоковую передачу и продолжение аудио.

Детали разработки

Это был порт с использованием ИИ. Claude Opus 4.6 занимался спецификацией и валидацией, GPT-5.3-Codex выполнял реализацию, а разработчик руководил проектом через OpenClaw.

Репозиторий доступен по адресу github.com/mznoj/echo-tts-mlx.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Логира: Аудит среды выполнения eBPF для запусков AI-агентов
Инструменты

Логира: Аудит среды выполнения eBPF для запусков AI-агентов

Logira — это инструмент командной строки для Linux, работающий только в режиме наблюдения. Он записывает события выполнения, файловые и сетевые события через eBPF во время запусков ИИ-агентов, с локальным хранилищем на каждый запуск в форматах JSONL и SQLite, а также со встроенными правилами обнаружения для доступа к учетным данным, изменений постоянства и подозрительных шаблонов.

OpenClawRadar
tmux-IDE: Терминальная мультиагентная среда разработки для Claude
Инструменты

tmux-IDE: Терминальная мультиагентная среда разработки для Claude

tmux-IDE — это открытый, декларативный терминальный IDE, ориентированный на агентную инженерию, который создаёт мультиагентные макеты для кодирующих агентов Claude. Он позволяет разработчикам загружаться в свою IDE через SSH, давать промты Claude и закрывать свой компьютер, пока Claude продолжает работать в tmux-сессиях.

OpenClawRadar
OpenAlly: Локальный ИИ-помощник для Android с управлением телефоном
Инструменты

OpenAlly: Локальный ИИ-помощник для Android с управлением телефоном

OpenAlly — это приложение для Android, которое запускает ИИ-ассистента локально на вашем телефоне через встроенный процесс Node.js, с 51 встроенным навыком и возможностями управления телефоном через компаньон Aster. Оно подключается к 19+ мессенджерам и поддерживает 18 провайдеров моделей с вашими собственными API-ключами.

OpenClawRadar
Монитор системного трея Windows для отслеживания квоты кода Claude
Инструменты

Монитор системного трея Windows для отслеживания квоты кода Claude

Приложение для системного трея Windows, которое отслеживает использование Claude Code с помощью цветного значка, автоматически обновляет данные о квотах каждые 5 минут через OAuth API Anthropic и предоставляет подробные панели управления, показывающие модели использования по часам, дням, неделям и месяцам.

OpenClawRadar