Создание локального голосового AI-ассистента с помощью SwiftUI и CSM-1B на Apple Silicon

✍️ OpenClawRadar📅 Опубликовано: 6 мая 2026 г.🔗 Source
Создание локального голосового AI-ассистента с помощью SwiftUI и CSM-1B на Apple Silicon
Ad

Разработчик поделился своим побочным проектом mobiGlas — приложением на SwiftUI, которое превращает AI-ассистента OpenClaw в голосового компаньона без использования рук. Приложение полностью работает на Apple Silicon с локальным распознаванием речи, локальной LLM и локальным клонированием голоса с помощью CSM-1B — без облачных зависимостей.

Ключевые детали

  • Триггер: Скажите "Hey Skippy" в AirPods, чтобы начать разговор.
  • Голос: Используется модель клонирования голоса CSM-1B, работающая локально на M2 Ultra. Генерирует около 15 секунд аудио примерно за 7 секунд.
  • Стек:
    • OpenClaw — фреймворк AI-ассистента, работающий на Mac
    • mobiGlas — приложение на SwiftUI с распознаванием речи в реальном времени и синтезом речи
    • CSM-1B — локальная модель клонирования голоса
    • AirPods — гарнитура для аудиоввода/вывода без рук
  • Статус: v0.1 (описывается как "коряво, но работает"). Ощущение прогулки с разговором с AI, по словам разработчика, "действительно необычно".
  • Пример голоса: Разработчик клонировал голос R.C. Bray (чтеца Expeditionary Force) для ассистента "Skippy".
Ad

Следующие шаги

Разработчик планирует сделать опыт более гладким для повседневных сценариев, таких как краткие новости, напоминания и обсуждение идей вслух.

Если вы экспериментируете с локальным голосовым AI на Apple Silicon, разработчик хочет обменяться опытом.

📖 Читать полный источник: r/openclaw

Ad

👀 Смотрите также

Навык Claude Code с открытым исходным кодом /unzuck организует ленты социальных сетей в единую панель управления.
Инструменты

Навык Claude Code с открытым исходным кодом /unzuck организует ленты социальных сетей в единую панель управления.

Бесплатный, открытый навык Claude Code под названием /unzuck параллельно сканирует ленты Hacker News, Reddit, LinkedIn, YouTube, Twitter/X, Instagram и Facebook с помощью автоматизации браузера, оценивает элементы по профилям интересов пользователей и генерирует интерактивные HTML-дашборды.

OpenClawRadar
LetMeWatch: Python-плагин добавляет анализ видео в Claude через обнаружение сцен с помощью FFmpeg
Инструменты

LetMeWatch: Python-плагин добавляет анализ видео в Claude через обнаружение сцен с помощью FFmpeg

Разработчик создал плагин на Python под названием LetMeWatch, который позволяет Клоду анализировать видео, используя FFmpeg для обнаружения сцен, извлекая только кадры, где меняется изображение, добавляя к ним временные метки и передавая их партиями в мультимодальное зрение Клода.

OpenClawRadar
Memtrace: постоянная, осведомлённая о времени память кодовой базы для агентов Claude Code
Инструменты

Memtrace: постоянная, осведомлённая о времени память кодовой базы для агентов Claude Code

Memtrace предоставляет всегда свежие снимки и битемпоральный повтор для агентов Claude Code, используя синтаксический анализ AST через Tree-sitter и гибридный поиск (BM25 + эмбеддинги Jina-code) с нулевой стоимостью вывода LLM во время индексации.

OpenClawRadar
GlycemicGPT: Самостоятельно развернутый ИИ-монитор диабета с BYOAI и Plugin SDK
Инструменты

GlycemicGPT: Самостоятельно развернутый ИИ-монитор диабета с BYOAI и Plugin SDK

GlycemicGPT — это открытая платформа для самостоятельного размещения, которая подключает Dexcom G7 и помпы Tandem к уровню анализа ИИ. Она предоставляет ежедневные сводки, анализ приема пищи, чат для бесед и настраиваемые оповещения, работающие на вашем собственном оборудовании.

OpenClawRadar