Claude Code로 Sotto 앱 구축: 로컬 음성-텍스트 데스크톱 앱

전문적인 코딩 경험이 없는 개발자가 Claude Code를 사용하여 완전히 기능하는 로컬 음성-텍스트 데스크톱 애플리케이션을 구축했습니다. 주로 재무 모델링에서 Excel과 SQL을 다루는 이 개발자는 클라우드 기반 구독 서비스를 대체하기 위해 이 도구를 만들었습니다.

구축된 내용

이 애플리케이션은 Sotto라고 불리며, GPU에서 Whisper를 실행하는 Windows용 로컬 음성-텍스트 도구입니다. 개발자는 (특히 4070 Ti GPU를 언급하며) 성능 좋은 하드웨어를 갖추고 있음에도 불구하고 음성 데이터가 기기를 떠나는 클라우드 기반 받아쓰기 서비스에 대한 불만족으로 동기를 얻었습니다.

주요 기능

어떤 애플리케이션에서든 접근 가능한 시스템 전체 핫키
말을 멈추면 자동으로 녹음 중지
마크다운 형식(Obsidian과 호환)으로 내보내는 더 긴 음성 메모용 두 번째 핫키
시스템 트레이 통합이 있는 설정 UI
듣는 동안 시각적 파형 표시기
자동 GPU 감지 및 모델 선택
커서 위치에 텍스트 삽입

기술적 세부사항

이 애플리케이션은 17개 파일에 걸쳐 약 2,200줄의 Python 코드로 구성되어 있습니다. 개발자에 따르면 Claude Code가 "대부분의" 구현을 작성했으며, 여기에는 다음이 포함됩니다:

스레딩 로직
Windows API 통합
Qt 기반 사용자 인터페이스

개발자는 요구사항 정의, 테스트, 버그 식별 및 기능 우선순위 설정을 처리했으며, Claude Code를 통해 실제로 구축 방법을 알지 못했던 기술 구성 요소의 구현에 의존했습니다.

사용 가능성

Sotto는 다음과 같은 요구사항과 함께 MIT 라이선스로 제공됩니다:

Windows 운영 체제
Python 3.10 이상
GPU 권장(필수 아님)

개발자는 최근 MacBook을 구입하고 그곳에서 이 도구를 사용하고 싶어하기 때문에 Mac 버전이 "곧 출시 예정"이라고 언급했습니다. 이 프로젝트는 https://github.com/mrobison12-oss/sotto에서 GitHub에 호스팅되어 있습니다.

📖 Read the full source: r/ClaudeAI

금융 모델러, Claude Code로 로컬 음성-도구 데스크톱 앱 구축

구축된 내용

주요 기능

기술적 세부사항

사용 가능성

👀 See Also

RunLobster AI 에이전트, 비즈니스 데이터 통합으로 운영 인사이트 제공

클로드 코드 에이전트 팀이 옵시디언 볼트를 사용해 4시간 만에 마이크로 SaaS 제품을 구축합니다

사용자가 Claude AI를 활용해 법적 경감 진술서 초안 작성에 성공

베이지안 모델을 활용한 Claude Pokemon 채팅의 의인화 분석