취약한 테스트 스크립트가 릴리스를 지연시킨 사례와 한 팀의 해결 방법

문제: 지표에 가려진 취약한 테스트
약 15명의 엔지니어로 구성된 소비자 앱 팀은 200개 이상의 테스트 케이스로 괜찮은 QA 환경을 갖추고 있다고 생각했습니다. 그들은 테스트 케이스 수로 QA 상태를 측정했는데, 이는 문서상으로는 훌륭해 보였습니다.
3월에 QA 엔지니어가 육아휴직을 떠났을 때, CI 파이프라인이 몇 달 동안 안정적이었던 플로우에서 실패하기 시작했습니다. 문제는 두 스프린트 전에 진행된 UI 리프레시로 요소들이 이동했고, Appium 스크립트의 로케이터가 이동되거나 이름이 변경된 요소를 가리키고 있었기 때문입니다. 앱은 사용자에게 거의 동일하게 보였지만, 스크립트는 적응할 수 없었습니다.
테스트 스위트를 몇 달 동안 건드리지 않았던 두 명의 엔지니어를 포함해 세 명이 이 문제를 해결하려 했습니다. 거의 일주일이 걸렸고, 마감일은 변하지 않았기 때문에 한 차례의 릴리즈는 적절한 회귀 테스트 없이 출시되었습니다.
유지보수의 실제 비용
QA 엔지니어가 복귀했을 때, 그는 주간 시간의 50-60%를 스크립트 유지보수에 소비하고 있음을 밝혔습니다: 로케이터 업데이트, UI 변경 후 깨진 부분 수정, 테스트 스위트 유지 등이었습니다. 실제 버그를 찾는 데는 그의 시간의 약 3분의 1만 소요되었습니다.
팀은 잘못된 것을 측정하고 있었음을 깨달았습니다. 테스트가 무너지지 않도록 유지하는 데 얼마나 많은 시간이 소요되는지 추적하는 사람은 아무도 없었습니다.
해결책: 로케이터를 넘어서
팀은 지난 몇 달 동안 로케이터에 전혀 의존하지 않는 도구를 사용하여 테스트 스위트를 재구축해 왔습니다. 테스트는 평이한 영어로 작성되며, 도구는 사람이 보는 방식으로 화면을 읽습니다. UI가 변경되면 적응합니다.
QA 엔지니어는 2년 만에 처음으로 월요일에 실제 업무를 시작하기 전에 수리해야 할 깨진 스크립트 목록 없이 출근했다고 보고했습니다.
로케이터 문제는 그들이 얼마나 빠르게 출시할 수 있는지에 대해 조용히 한계를 설정하고 있었고, 그것이 무너질 때까지 완전히 인식하지 못했습니다.
📖 Read the full source: r/openclaw
👀 See Also

개발자가 클로드 코드로 하루 만에 3D GitHub 도시 시각화를 만듦
한 개발자가 Git City를 구축했습니다. 이는 GitHub 사용자가 커밋 수에 따라 높이가, 저장소 수에 따라 너비가 결정되는 픽셀 아트 건물로 나타나는 3D 시각화 도구로, Claude Code만을 사용해 하루 만에 완성되었습니다. 이 프로젝트는 Next.js, Three.js, Supabase, Vercel을 사용합니다.

로컬 LLM으로 'Slay the Spire 2' 에이전트 구축하기: 교훈과 미해결 과제
개발자가 Qwen3.5-27B를 KoboldCPP/Ollama를 통해 사용하여 Slay the Spire 2를 플레이하는 에이전트를 구축했습니다. 상태 기반 도구 라우팅 및 단일 도구 모드와 같은 기술을 사용하여 액션당 약 10초, 액션 성공률 약 88%를 달성했으며, 프롬프트 일관성과 도구 호출 신뢰성과 같은 개방형 문제를 확인했습니다.

실용적인 오픈클로 설정: 맥 미니 구성, 비용 관리, 일일 자동화
한 개발자가 Mac Mini에서 실행되는 기본 OpenClaw 어시스턴트 설정을 공유하며, 보안 조치, 초기 API 비용 $60-70에서 일일 $0.60-2.60으로의 비용 최적화, 그리고 Telegram, Dropbox, Composio를 통한 Google Workspace 등 실용적인 통합 사항을 상세히 설명합니다.

클로드가 불량 맥북에 대해 소송 전 통지서를 작성하고 전액 환불을 받은 방법
Reddit 사용자가 Claude를 활용해 인도 소비자법을 분석하고, 소송 전 통지를 작성하여 처음에 85% 환불만 제시했던 회사로부터 40,219루피(약 480달러)를 돌려받은 방법을 설명합니다.