SwiftUI와 CSM-1B로 Apple Silicon에서 로컬 음성 AI 어시스턴트 구축하기

한 개발자가 자신의 사이드 프로젝트 mobiGlas를 공유했습니다. 이는 SwiftUI 앱으로, OpenClaw AI 어시스턴트를 핸즈프리 음성 동반자로 전환합니다. 앱은 Apple Silicon에서 완전히 로컬로 실행되며, 로컬 음성-텍스트, 로컬 LLM, CSM-1B를 사용한 로컬 음성 복제를 통해 클라우드 의존성이 없습니다.
주요 세부 사항
- 트리거: AirPods에 "Hey Skippy"라고 말하면 대화가 시작됩니다.
- 음성: M2 Ultra에서 로컬로 실행되는 CSM-1B 음성 복제 모델을 사용합니다. 약 15초 분량의 오디오를 약 7초 만에 생성합니다.
- 스택:
- OpenClaw — Mac에서 실행되는 AI 어시스턴트 프레임워크
- mobiGlas — 실시간 음성-텍스트 및 텍스트-음성 변환이 가능한 SwiftUI 앱
- CSM-1B — 로컬 음성 복제 모델
- AirPods — 핸즈프리 오디오 입출력
- 상태: v0.1 ("조잡하지만 기능 작동"으로 설명됨). AI와 대화하며 걸어 다니는 느낌은 "진정으로 신선하다"고 합니다.
- 음성 예시: 개발자는 어시스턴트 "Skippy"를 위해 R.C. Bray(Expeditionary Force의 나레이터)의 목소리를 복제했습니다.
다음 단계
개발자는 뉴스 브리핑, 알림, 아이디어를 큰 소리로 이야기하는 등의 일상적인 사용 사례를 위해 경험을 개선할 계획입니다.
Apple Silicon에서 로컬 음성 AI를 실험 중이라면, 개발자가 의견을 교환하고 싶어 합니다.
📖 전체 출처 읽기: r/openclaw
👀 See Also

Claude Code 사용자가 문제 해결 컨텍스트를 캡처하는 nvm 플러그인을 구축합니다
한 개발자가 nvm(비휘발성 메모리)이라는 Claude 플러그인을 만들어 Claude 세션 기록을 마크다운 카드로 변환하여 문제 해결 결정과 재사용 가능한 통찰을 문서화합니다. 이 도구는 AI 코딩 어시스턴트 사용 시 문제가 어떻게 해결되었는지 추적을 잃는 문제를 해결합니다.

Anthropic과 OpenAI의 빠른 LLM 추론 비교 개요
Anthropic과 OpenAI는 더 빠른 LLM 추론을 위해 각각 다른 '빠른 모드' 기능을 출시했으며, OpenAI는 Cerebras 칩을 활용해 더 큰 속도 향상을 이루었습니다

컨텍스트-링크 v1.0.0: 로컬 MCP 서버로 Claude Code 토큰 사용량 91% 감소
context-link v1.0.0은 Tree-sitter를 사용하여 코드베이스를 인덱싱하는 로컬 MCP 서버로, Claude에게 필요한 정확한 심볼, 의존성 및 구조만 제공하여 특정 경우에는 토큰 사용량을 91% 줄이고, 전체 작업에서는 70-80% 절감합니다.

ClearSpec: Claude 코드의 환각 현상을 줄이기 위한 사양 생성기
ClearSpec은 일반 영어 설명에서 구조화된 명세서를 생성하는 도구로, GitHub 저장소에 연결하여 실제 파일 경로와 의존성을 참조한 다음, Claude Code에 더 나은 컨텍스트를 제공하기 위해 해당 명세서를 프롬프트로 사용합니다.