Claude Code로 Vext 구축: 오프라인 음성-텍스트 앱 사례

한 개발자가 Vext라는 네이티브 macOS 음성-텍스트 앱을 만든 경험을 공유했습니다. 이 앱은 Apple Neural Engine에서 Whisper를 사용하여 전적으로 기기 내에서 실행됩니다. 클라우드, 계정, 구독이 필요 없습니다. 앱은 Rust 코어와 Swift/SwiftUI UI, Core ML 추론을 사용하며, Claude Code가 주요 코딩 파트너로 사용되었습니다.

주요 기능

어디서든 단축키를 누르고 → 말하고 → 놓으면 텍스트가 커서에 나타납니다
60초 오디오를 약 400ms에 변환 (실시간의 150배)
스마트 정리: 불필요한 단어 제거, 음성을 가독성 있게 재구성
99개 이상의 언어로 실시간 번역
화자 분리 및 자동 요약 기능이 포함된 회의 기록
음성 녹음 중 화면 녹화 (스크린샷 자동 첨부)

Claude Code의 강점

Apple Silicon에서의 Whisper: 양자화 전략, 모델 청킹 및 Neural Engine에서 효율적으로 실행되기 위한 Core ML 변환 메모리 레이아웃을 반복적으로 개선하는 데 도움을 주었습니다.
단축키 시스템 아키텍처: 적절한 접근성 권한을 가진 CGEventTap 사용을 제안하고, 녹음 시작/중지와 클립보드 주입 간의 경쟁 조건 디버깅에 도움을 주었습니다.
Rust ↔ Swift FFI: FFI 바인딩을 생성하고 C 인터페이스 레이어의 여러 메모리 안전 문제를 발견했습니다.

Claude Code의 한계

온라인에 잘 문서화되지 않은 macOS 특화 API 미묘한 차이에 어려움을 겪었습니다. CGEventTap의 예외 사항은 Apple 헤더를 직접 분석해야 했습니다.
전체 Rust + Swift 코드베이스에서 컨텍스트 창이 병목 현상이 되었습니다. 개발자는 프로젝트를 모듈로 나누고 한 번에 하나씩 작업했습니다.