휴대폰 바이브 코딩으로 20만 라인 프로덕션 앱 구축

한 개발자가 '바이브 코딩'이 고복잡도 프로젝트를 처리할 수 있는지 실험하기 위해 전문적인 모바일 바이브 코딩 도구인 Vibe Remote(현재 App Store에서 무료 이용 가능)를 구축했습니다. 이 도구를 사용하면 Tailscale을 구성하지 않고도 이동 중에 코딩할 수 있습니다. 사용자는 QR 코드를 스캔하고 휴대폰에서 코딩을 시작합니다.

기술 스택 및 개발 과정

이 프로젝트는 다중 플랫폼 아키텍처를 사용합니다: CLI, 웹(https://vibe-remote.com), Go 백엔드, 그리고 Swift로 된 네이티브 iOS/macOS입니다. 글로벌 노드, 보안 커스텀 프로토콜, TUI 인터페이스 기능을 갖추고 있습니다.

제약 조건은 간단했습니다: 이 도구를 사용해 도구를 구축하라. 첫 번째 버전이 통신할 수 있게 된 후, 개발자는 노트북 사용을 완전히 중단했습니다. 코드의 95% 이상은 외출하며 생활하는 동안 앱을 통해 Claude Code에 메시지를 보내 작성되었습니다.

일일 워크플로우 및 솔루션

일상적인 루틴은 집에서 여러 병렬 세션에 걸쳐 5~10개의 수정 포인트를 쌓은 다음, AI에게 커스텀 deploy-to-iphone 스킬을 호출하라고 지시해 빌드를 푸시하는 방식이었습니다. AI가 작업하는 동안 개발자는 짧은 드라마를 시청했습니다. 공원에서는 iOS 변경 사항을 집 배포를 위해 일괄 처리했지만, Go 백엔드와 SSR 사이트의 경우 AI에게 로컬 서버를 재시작하라고 지시했습니다.

'공원에서 로컬 변경 사항을 볼 수 없다'는 문제를 해결하기 위해, 개발자는 AI에게 내장 브라우저와 앱 자체로의 프록시 터널을 구축하도록 했습니다. 이를 통해 집 컴퓨터의 localhost:3000을 보안 프로토콜을 통해 휴대폰에서 직접 미리 볼 수 있게 되었습니다.

코드량 및 속도

총 코드 줄 수: 약 200,000줄 (Go 140k, Swift 60k)
속도 곡선: 처음 3주 동안 15만 줄이 생성되었습니다. 속도는 하루 1만 줄에서 1천 줄로 떨어졌고, 마무리 단계에서는 하루 100~300줄의 정밀 수정으로 감소했습니다.
소진: '미세 조정' 단계는 초기 구축보다 더 피로했습니다. 채팅을 통한 'QA'로 인한 높은 정신적 부담으로 미세한 UX 세부 사항을 지속적으로 검증해야 했습니다.

주요 교훈

DRY 문제

프로젝트가 거대해지면 AI는 기존 구현을 검색하지 못하고 논리를 중복하기 시작합니다. 해결책: claude.md 지시사항을 '법률 조문'처럼 취급하고 명시적으로 프롬프트를 작성하는 것입니다. '기능 X에 대해 유사한 논리를 구현했습니다. 찾아서 추상화하고 재사용하세요. 다시 구현하지 마세요.' 이렇게 하지 않으면, 한 곳에서 버그를 수정해도 중복 구현에 남아 있는 '좀비 코드'가 생깁니다.

TDD 함정

처음에는 모든 테스트가 기능적 분기를 설명하고, 먼저 실패한 후 통과하는 엄격한 TDD 흐름(단위 + E2E 테스트)을 사용했습니다. Opus 4.6은 이에 뛰어나지만, E2E 테스트는 병목 현상이 되었습니다. 전체 E2E 스위트 실행 대기로 효율성이 떨어졌습니다. 개발자는 결국 '바이브'를 빠르게 유지하기 위해 E2E를 제거하고 고밀도 단위 테스트를 선호하게 되었습니다.

'슈퍼파워' 도구 버리기

개발자는 '슈퍼파워' 확장 프로그램을 제거했습니다. 작업의 95%에 대해 여러 세션의 순수 자연어가 더 낫다는 것을 발견했기 때문입니다. AI가 막힐 때만 '계획 모드'를 사용하며, 이 프롬프트를 적용합니다: '이것을 몇 번 시도했지만 실패했습니다. 피드백을 요약하고, 업계 모범 사례를 연구한 다음, 원샷 실행 계획을 제시하세요.' 하나의 거대하고 복잡한 프롬프트보다 여러 병렬 스레드에서 작고 정확한 요구 사항을 제시하는 것이 세부 사항 중심 반복에 더 효과적입니다.