Создание локального голосового AI-ассистента с помощью SwiftUI и CSM-1B на Apple Silicon

Разработчик поделился своим побочным проектом mobiGlas — приложением на SwiftUI, которое превращает AI-ассистента OpenClaw в голосового компаньона без использования рук. Приложение полностью работает на Apple Silicon с локальным распознаванием речи, локальной LLM и локальным клонированием голоса с помощью CSM-1B — без облачных зависимостей.
Ключевые детали
- Триггер: Скажите "Hey Skippy" в AirPods, чтобы начать разговор.
- Голос: Используется модель клонирования голоса CSM-1B, работающая локально на M2 Ultra. Генерирует около 15 секунд аудио примерно за 7 секунд.
- Стек:
- OpenClaw — фреймворк AI-ассистента, работающий на Mac
- mobiGlas — приложение на SwiftUI с распознаванием речи в реальном времени и синтезом речи
- CSM-1B — локальная модель клонирования голоса
- AirPods — гарнитура для аудиоввода/вывода без рук
- Статус: v0.1 (описывается как "коряво, но работает"). Ощущение прогулки с разговором с AI, по словам разработчика, "действительно необычно".
- Пример голоса: Разработчик клонировал голос R.C. Bray (чтеца Expeditionary Force) для ассистента "Skippy".
Следующие шаги
Разработчик планирует сделать опыт более гладким для повседневных сценариев, таких как краткие новости, напоминания и обсуждение идей вслух.
Если вы экспериментируете с локальным голосовым AI на Apple Silicon, разработчик хочет обменяться опытом.
📖 Читать полный источник: r/openclaw
👀 Смотрите также

Навык Claude Code с открытым исходным кодом /unzuck организует ленты социальных сетей в единую панель управления.
Бесплатный, открытый навык Claude Code под названием /unzuck параллельно сканирует ленты Hacker News, Reddit, LinkedIn, YouTube, Twitter/X, Instagram и Facebook с помощью автоматизации браузера, оценивает элементы по профилям интересов пользователей и генерирует интерактивные HTML-дашборды.

LetMeWatch: Python-плагин добавляет анализ видео в Claude через обнаружение сцен с помощью FFmpeg
Разработчик создал плагин на Python под названием LetMeWatch, который позволяет Клоду анализировать видео, используя FFmpeg для обнаружения сцен, извлекая только кадры, где меняется изображение, добавляя к ним временные метки и передавая их партиями в мультимодальное зрение Клода.

Memtrace: постоянная, осведомлённая о времени память кодовой базы для агентов Claude Code
Memtrace предоставляет всегда свежие снимки и битемпоральный повтор для агентов Claude Code, используя синтаксический анализ AST через Tree-sitter и гибридный поиск (BM25 + эмбеддинги Jina-code) с нулевой стоимостью вывода LLM во время индексации.

GlycemicGPT: Самостоятельно развернутый ИИ-монитор диабета с BYOAI и Plugin SDK
GlycemicGPT — это открытая платформа для самостоятельного размещения, которая подключает Dexcom G7 и помпы Tandem к уровню анализа ИИ. Она предоставляет ежедневные сводки, анализ приема пищи, чат для бесед и настраиваемые оповещения, работающие на вашем собственном оборудовании.