Claude Code로 구축한 로컬 음성-텍스트 macOS 앱: Vext 사례 연구

한 개발자가 Vext라는 네이티브 macOS 음성-텍스트 앱을 만든 경험을 공유했습니다. 이 앱은 Apple Neural Engine에서 Whisper를 사용하여 전적으로 기기 내에서 실행됩니다. 클라우드, 계정, 구독이 필요 없습니다. 앱은 Rust 코어와 Swift/SwiftUI UI, Core ML 추론을 사용하며, Claude Code가 주요 코딩 파트너로 사용되었습니다.
주요 기능
- 어디서든 단축키를 누르고 → 말하고 → 놓으면 텍스트가 커서에 나타납니다
- 60초 오디오를 약 400ms에 변환 (실시간의 150배)
- 스마트 정리: 불필요한 단어 제거, 음성을 가독성 있게 재구성
- 99개 이상의 언어로 실시간 번역
- 화자 분리 및 자동 요약 기능이 포함된 회의 기록
- 음성 녹음 중 화면 녹화 (스크린샷 자동 첨부)
Claude Code의 강점
- Apple Silicon에서의 Whisper: 양자화 전략, 모델 청킹 및 Neural Engine에서 효율적으로 실행되기 위한 Core ML 변환 메모리 레이아웃을 반복적으로 개선하는 데 도움을 주었습니다.
- 단축키 시스템 아키텍처: 적절한 접근성 권한을 가진 CGEventTap 사용을 제안하고, 녹음 시작/중지와 클립보드 주입 간의 경쟁 조건 디버깅에 도움을 주었습니다.
- Rust ↔ Swift FFI: FFI 바인딩을 생성하고 C 인터페이스 레이어의 여러 메모리 안전 문제를 발견했습니다.
Claude Code의 한계
- 온라인에 잘 문서화되지 않은 macOS 특화 API 미묘한 차이에 어려움을 겪었습니다. CGEventTap의 예외 사항은 Apple 헤더를 직접 분석해야 했습니다.
- 전체 Rust + Swift 코드베이스에서 컨텍스트 창이 병목 현상이 되었습니다. 개발자는 프로젝트를 모듈로 나누고 한 번에 하나씩 작업했습니다.
가격
getvext.app에서 무료로 다운로드하고 체험해보세요. 계속 사용하려면 일회성으로 $49 (구독 없음). 코드 VEXT50을 입력하면 50% 할인됩니다.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

Memtrace: 클로드 코드 에이전트를 위한 지속적이고 시간 인식적인 코드베이스 메모리
Memtrace는 Tree-sitter AST 파싱과 하이브리드 검색(BM25 + Jina-code 임베딩)을 사용하여 Claude Code 에이전트에게 항상 최신 상태의 스냅샷과 이중 시간 재생을 제공하며, 인덱싱 중 LLM 추론 비용이 0입니다.

OpenClaw 구성 요소 추출: 레인 큐와 메모리 시스템에 관한 개발자 경험
한 개발자가 개인 AI 에이전트에서 사용하기 위해 OpenClaw의 특정 컴포넌트를 추출하려 시도했으며, Lane Queue 작업 실행 시스템을 테스트하고 메모리 검색 시스템을 검토했습니다. Lane Queue는 문서를 기반으로 Python에서 성공적으로 재구현되었으며, 문서의 공백과 13가지 구현 문제가 드러났습니다.

Zap Code: 실제 HTML/CSS/JS를 아이들에게 가르치는 AI 코드 생성기
Zap Code는 8-16세 어린이를 위해 일반 영어 설명으로 작동하는 HTML, CSS, JavaScript를 생성합니다. 세 가지 상호작용 모드를 제공하며 점진적 복잡성 엔진이 포함된 샌드박스 iframe에서 실행됩니다.

ATLAS: 적응형 테스트 타임 학습 프레임워크, 500달러 GPU로 코딩 벤치마크에서 Claude Sonnet을 능가
ATLAS는 고정된 14B 모델을 단일 소비자 GPU에서 실행하여 LiveCodeBench에서 74.6%의 pass@1-v(k=3)를 달성했습니다. 제약 기반 생성과 자가 검증 반복 개선을 통해 Claude 4.5 Sonnet의 71.4%를 훨씬 낮은 비용으로 능가합니다.