금융 모델러, Claude Code로 로컬 음성-도구 데스크톱 앱 구축

전문적인 코딩 경험이 없는 개발자가 Claude Code를 사용하여 완전히 기능하는 로컬 음성-텍스트 데스크톱 애플리케이션을 구축했습니다. 주로 재무 모델링에서 Excel과 SQL을 다루는 이 개발자는 클라우드 기반 구독 서비스를 대체하기 위해 이 도구를 만들었습니다.
구축된 내용
이 애플리케이션은 Sotto라고 불리며, GPU에서 Whisper를 실행하는 Windows용 로컬 음성-텍스트 도구입니다. 개발자는 (특히 4070 Ti GPU를 언급하며) 성능 좋은 하드웨어를 갖추고 있음에도 불구하고 음성 데이터가 기기를 떠나는 클라우드 기반 받아쓰기 서비스에 대한 불만족으로 동기를 얻었습니다.
주요 기능
- 어떤 애플리케이션에서든 접근 가능한 시스템 전체 핫키
- 말을 멈추면 자동으로 녹음 중지
- 마크다운 형식(Obsidian과 호환)으로 내보내는 더 긴 음성 메모용 두 번째 핫키
- 시스템 트레이 통합이 있는 설정 UI
- 듣는 동안 시각적 파형 표시기
- 자동 GPU 감지 및 모델 선택
- 커서 위치에 텍스트 삽입
기술적 세부사항
이 애플리케이션은 17개 파일에 걸쳐 약 2,200줄의 Python 코드로 구성되어 있습니다. 개발자에 따르면 Claude Code가 "대부분의" 구현을 작성했으며, 여기에는 다음이 포함됩니다:
- 스레딩 로직
- Windows API 통합
- Qt 기반 사용자 인터페이스
개발자는 요구사항 정의, 테스트, 버그 식별 및 기능 우선순위 설정을 처리했으며, Claude Code를 통해 실제로 구축 방법을 알지 못했던 기술 구성 요소의 구현에 의존했습니다.
사용 가능성
Sotto는 다음과 같은 요구사항과 함께 MIT 라이선스로 제공됩니다:
- Windows 운영 체제
- Python 3.10 이상
- GPU 권장(필수 아님)
개발자는 최근 MacBook을 구입하고 그곳에서 이 도구를 사용하고 싶어하기 때문에 Mac 버전이 "곧 출시 예정"이라고 언급했습니다. 이 프로젝트는 https://github.com/mrobison12-oss/sotto에서 GitHub에 호스팅되어 있습니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

OpenClaw 사용자가 에이전트 코딩 접근 방식으로 캐릭터 채팅 앱을 구축합니다
자신을 비기술적이라고 묘사하는 OpenClaw 사용자가 에이전트 코딩을 활용하여 7일 만에 작동하는 캐릭터 채팅 애플리케이션을 개발했으며, 자신의 역할이 기존 프로그래밍 방식에서 AI가 생성한 작업을 검토하는 방식으로 전환되었다고 언급했습니다.

자기 개선 AI 에이전트가 프로세스 비대화로 인해 정체되었으며, 설정의 60%를 줄여 해결했습니다.
한 개발자가 자기 개선형 AI 에이전트를 사용하면서 초기 개선 후 성능 정체에 부딪혔다고 보고했습니다. 버그 때문이 아니라 모든 개선이 더 많은 프로세스 오버헤드를 추가했기 때문에 에이전트는 계속된 개발에도 불구하고 느려지고 있었습니다.

OpenClaw 오케스트레이터 라우팅 문제: 위임 실패 시
한 개발자가 OpenClaw 메인 오케스트레이터가 명시적인 라우팅 테이블과 위임 규칙을 사용함에도 불구하고, 요청의 약 40-50%를 전문 서브 에이전트로 라우팅하는 대신 직접 처리하는 문제를 보고했습니다. 이 설정에는 Gmail, Todoist, Notion, 날씨 등 서비스를 위한 7개의 전문 에이전트가 포함되어 있습니다.

OpenClaw 에이전트가 Zork 텍스트 어드벤처 게임을 자율적으로 플레이합니다
한 개발자가 자신의 OpenClaw 에이전트가 자율적으로 Zork 인터프리터를 찾아 설치한 후, 약 30초 만에 전체 게임을 두 번 플레이하며 350점 만점 중 50점을 획득했고, 작업 사이사이에 계속 플레이할 계획이라고 보고했습니다.