휴대폰으로 바이브 코딩을 통해 20만 라인의 프로덕션 앱 구축하기

✍️ OpenClawRadar📅 게시일: March 27, 2026🔗 Source
휴대폰으로 바이브 코딩을 통해 20만 라인의 프로덕션 앱 구축하기
Ad

한 개발자가 '바이브 코딩'이 고복잡도 프로젝트를 처리할 수 있는지 실험하기 위해 전문적인 모바일 바이브 코딩 도구인 Vibe Remote(현재 App Store에서 무료 이용 가능)를 구축했습니다. 이 도구를 사용하면 Tailscale을 구성하지 않고도 이동 중에 코딩할 수 있습니다. 사용자는 QR 코드를 스캔하고 휴대폰에서 코딩을 시작합니다.

기술 스택 및 개발 과정

이 프로젝트는 다중 플랫폼 아키텍처를 사용합니다: CLI, 웹(https://vibe-remote.com), Go 백엔드, 그리고 Swift로 된 네이티브 iOS/macOS입니다. 글로벌 노드, 보안 커스텀 프로토콜, TUI 인터페이스 기능을 갖추고 있습니다.

제약 조건은 간단했습니다: 이 도구를 사용해 도구를 구축하라. 첫 번째 버전이 통신할 수 있게 된 후, 개발자는 노트북 사용을 완전히 중단했습니다. 코드의 95% 이상은 외출하며 생활하는 동안 앱을 통해 Claude Code에 메시지를 보내 작성되었습니다.

일일 워크플로우 및 솔루션

일상적인 루틴은 집에서 여러 병렬 세션에 걸쳐 5~10개의 수정 포인트를 쌓은 다음, AI에게 커스텀 deploy-to-iphone 스킬을 호출하라고 지시해 빌드를 푸시하는 방식이었습니다. AI가 작업하는 동안 개발자는 짧은 드라마를 시청했습니다. 공원에서는 iOS 변경 사항을 집 배포를 위해 일괄 처리했지만, Go 백엔드와 SSR 사이트의 경우 AI에게 로컬 서버를 재시작하라고 지시했습니다.

'공원에서 로컬 변경 사항을 볼 수 없다'는 문제를 해결하기 위해, 개발자는 AI에게 내장 브라우저와 앱 자체로의 프록시 터널을 구축하도록 했습니다. 이를 통해 집 컴퓨터의 localhost:3000을 보안 프로토콜을 통해 휴대폰에서 직접 미리 볼 수 있게 되었습니다.

코드량 및 속도

  • 총 코드 줄 수: 약 200,000줄 (Go 140k, Swift 60k)
  • 속도 곡선: 처음 3주 동안 15만 줄이 생성되었습니다. 속도는 하루 1만 줄에서 1천 줄로 떨어졌고, 마무리 단계에서는 하루 100~300줄의 정밀 수정으로 감소했습니다.
  • 소진: '미세 조정' 단계는 초기 구축보다 더 피로했습니다. 채팅을 통한 'QA'로 인한 높은 정신적 부담으로 미세한 UX 세부 사항을 지속적으로 검증해야 했습니다.
Ad

주요 교훈

DRY 문제

프로젝트가 거대해지면 AI는 기존 구현을 검색하지 못하고 논리를 중복하기 시작합니다. 해결책: claude.md 지시사항을 '법률 조문'처럼 취급하고 명시적으로 프롬프트를 작성하는 것입니다. '기능 X에 대해 유사한 논리를 구현했습니다. 찾아서 추상화하고 재사용하세요. 다시 구현하지 마세요.' 이렇게 하지 않으면, 한 곳에서 버그를 수정해도 중복 구현에 남아 있는 '좀비 코드'가 생깁니다.

TDD 함정

처음에는 모든 테스트가 기능적 분기를 설명하고, 먼저 실패한 후 통과하는 엄격한 TDD 흐름(단위 + E2E 테스트)을 사용했습니다. Opus 4.6은 이에 뛰어나지만, E2E 테스트는 병목 현상이 되었습니다. 전체 E2E 스위트 실행 대기로 효율성이 떨어졌습니다. 개발자는 결국 '바이브'를 빠르게 유지하기 위해 E2E를 제거하고 고밀도 단위 테스트를 선호하게 되었습니다.

'슈퍼파워' 도구 버리기

개발자는 '슈퍼파워' 확장 프로그램을 제거했습니다. 작업의 95%에 대해 여러 세션의 순수 자연어가 더 낫다는 것을 발견했기 때문입니다. AI가 막힐 때만 '계획 모드'를 사용하며, 이 프롬프트를 적용합니다: '이것을 몇 번 시도했지만 실패했습니다. 피드백을 요약하고, 업계 모범 사례를 연구한 다음, 원샷 실행 계획을 제시하세요.' 하나의 거대하고 복잡한 프롬프트보다 여러 병렬 스레드에서 작고 정확한 요구 사항을 제시하는 것이 세부 사항 중심 반복에 더 효과적입니다.

Git 작업 트리 걱정 그만하기

많은 사람들이 에이전트별 별도의 작업 트리를 권장하지만, 개발자는 동의하지 않습니다. 개발자는 동일한 브랜치에서 최대 40개 이상의 에이전트를 동시에 실행했으며, AI를 신뢰하기만 하면 작동한다는 것을 발견했습니다.

📖 전체 원문 읽기: r/ClaudeAI

Ad

👀 See Also

자체 호스팅된 Qwen3 235B와 vLLM을 사용하여 6개 에이전트 행동 코칭 파이프라인 실행하기
Use Cases

자체 호스팅된 Qwen3 235B와 vLLM을 사용하여 6개 에이전트 행동 코칭 파이프라인 실행하기

한 개발자가 vLLM을 통해 완전히 자체 호스팅된 Qwen3 모델로 실행되는 행동 코칭을 위한 6-에이전트 인지 파이프라인을 구축했습니다. 개발에는 2개의 RTX 4090에서 Qwen3 30B를 사용했으며, 프로덕션에는 RunPod A40 팟에서 Qwen3 235B를 사용합니다.

OpenClawRadar
Qwen 27B 모델, 장문 컨텍스트 로어 분석에서 강력한 성능 보여
Use Cases

Qwen 27B 모델, 장문 컨텍스트 로어 분석에서 강력한 성능 보여

한 사용자가 Qwen 27B가 복잡한 80K 토큰 분량의 스토리 문서를 효과적으로 분석하여, 상세한 판타지 세계관 구축 작업에서 Gemma 3 27B나 Reka Flash와 같은 다른 로컬 모델들을 능가한다고 보고했습니다. 긴 문맥 처리에는 Q4-K-XL 양자화가 속도와 품질의 최적 균형을 제공합니다.

OpenClawRadar
SDR, AI 생성 비디오 후속 조치로 냉각된 D2C 잠재고객 재활성화
Use Cases

SDR, AI 생성 비디오 후속 조치로 냉각된 D2C 잠재고객 재활성화

D2C 브랜드를 대상으로 하는 SaaS 회사의 SDR이 텍스트 이메일 대신 AI 생성 동영상 후속 조치를 사용한 성공 사례를 보고했습니다. 워크플로는 Claude에 프롬프트 작성, Magic Hour로 동영상 생성, 선택적으로 ElevenLabs로 보이스오버 다듬기를 포함합니다.

OpenClawRadar
리드 생성 및 CRM 자동화 with OpenClaw
Use Cases

리드 생성 및 CRM 자동화 with OpenClaw

없음

u/adamb0mbNZ