AWS에서 Claude Code로 월 0.01달러에 서버리스 AI 에이전트 플랫폼 구축하기

프로젝트 개요
Serverless OpenClaw는 5주에 걸쳐 29시간 동안 Claude Code와의 대화형 프롬프트를 통해 완전히 구축된 풀스택 서버리스 AI 에이전트 플랫폼입니다. 이 플랫폼은 React 웹 채팅 UI와 Telegram 봇을 갖춘 AWS에서 OpenClaw AI 에이전트를 주문형으로 실행하며, 전체 인프라를 단일 cdk deploy 명령으로 배포합니다.
기술적 세부사항
비용 최적화: 이 프로젝트는 일반적인 ~$70+ 서버리스 설정에서 Lambda에서 월 $0.01의 비용으로 월간 비용을 줄였으며, 유휴 비용은 전혀 발생하지 않습니다. 구체적으로 제거된 항목은 다음과 같습니다:
- NAT Gateway: -$32/월
- ALB (애플리케이션 로드 밸런서): -$18/월
- Fargate 상시 실행: -$15/월
- 인터페이스 VPC 엔드포인트: 각각 -$7/월
- Provisioned DynamoDB: 가변적 절감
성능 지표:
- 콜드 스타트: 1.35초 (Lambda), 0.12초 웜
- 개발 중 총 AWS 비용: 약 $0.25
- 월간 운영 비용: 약 $0.01 (Lambda)
코드 품질:
- 단위 테스트: 233개
- E2E 테스트: 35개
- CDK 스택: 8개
- TypeScript 패키지: 6개 (모노레포)
개발 과정
전체 프로젝트는 수동 코딩 없이—단지 프롬프트, 검토 및 과정 수정만으로 구축되었습니다. Claude Code는 다음 작업에 사용되었습니다:
- 아키텍처 설계: "월 $1 미만의 비용으로 서버리스 플랫폼 설계" → Claude Code가 PRD, CDK 스택, 네트워크 설계를 생성
- TDD 워크플로: Claude Code가 테스트를 먼저 작성한 후 구현 (단일 배포 전 233개 테스트)
- 디버깅 세션: Docker 빌드 실패, 콜드 스타트 최적화 (68초 → 1.35초), WebSocket 인증 문제
- 2단계 마이그레이션: 프로젝트 중간에 Fargate에서 Lambda 컨테이너 이미지로 이동, S3 세션 지속성 및 스마트 라우팅 포함
프롬프트는 원래 한국어로 작성되었으며, Claude Code는 이중 언어 개발을 원활하게 처리했습니다.
기술 스택
AWS에서 TypeScript 모노레포(6개 패키지) 사용: IaC용 CDK, API Gateway(WebSocket + REST), 컴퓨팅용 Lambda + Fargate Spot, DynamoDB, S3, Cognito 인증, CloudFront + React SPA, Telegram Bot API. Anthropic API 및 Amazon Bedrock을 통한 다중 LLM 지원.
실용적인 패턴
ALB 대신 API Gateway: 월 $18+ 절감. Lambda 핸들러와 함께 API Gateway에서 WebSocket + REST 사용.
튜토리얼 구조
7장으로 구성된 "바이브 코딩" 튜토리얼은 모든 프롬프트, 실패 및 수정 사항을 문서화합니다:
- 1장: 월 $1 도전 (~2시간) - PRD, 아키텍처 설계, 비용 분석
- 2장: 주말 동안의 MVP (~8시간) - 10단계 1단계, CDK 스택, TDD
- 3장: 배포 현실 점검 (~4시간) - Docker, 비밀, 인증, 첫 실제 배포
- 4장: 콜드 스타트 전투 (~6시간) - Docker 최적화, CPU 튜닝, 사전 워밍업
- 5장: Lambda 마이그레이션 (~4시간) - 2단계, 내장 에이전트, S3 세션
- 6장: 스마트 라우팅 (~3시간) - Lambda/Fargate 하이브리드, 콜드 스타트 미리보기
- 7장: 릴리스 자동화 (~2시간) - 기술, 병렬 검토, GitHub 릴리스
각 장에는 다음이 포함됩니다: 실제 제공된 프롬프트 → Claude Code가 수행한 작업 → 무엇이 고장났는지 → 어떻게 수정했는지 → 얻은 교훈 → 재현 가능한 명령어.
📖 전체 Source 읽기: r/ClaudeAI
👀 See Also

Qwen3.5-397B MoE, M1 Ultra에서 페이지드 전문가 로딩으로 14GB RAM에서 실행
Paged MoE 엔진은 20개의 전문가만 RAM에 상주시키고 나머지는 SSD에서 지연 로딩하여, 64GB Mac Studio에서 209GB 397B 모델을 1.59 tok/s, 최대 RAM 14GB로 실행합니다. 소형 모델 벤치마크 포함.

Windows 11 Home에서 Claude Desktop 작업 공간 VM 서비스 문제 수정
커뮤니티에서 개발한 수정 사항이 Windows 11 Home의 Claude Desktop 작업 공간 기능에서 발생하는 'VM 서비스가 실행 중이지 않음' 오류를 해결합니다. 수동 PowerShell 명령과 GitHub에서 사용 가능한 자동화 도구가 제공됩니다.

클로드 코워크를 위한 커스텀 스킬 제작: 모범 사례와 형식
Claude Co-Work의 새로운 기능과 최근 스킬 업데이트를 통해 개발자들은 플랫폼 내 워크플로우를 향상시키기 위한 맞춤형 스킬 제작을 탐색하기 시작했습니다. 한 사용자는 Claude Co-Work를 효과적으로 활용하기 위한 여정을 공유하며, 새로운 스킬을 작업 환경에 통합하는 데 필요한 올바른 파일 형식과 배포 전략을 이해하는 것의 중요성을 강조했습니다.

플러그인 없이 OpenClaw 에이전트를 위한 4-파일 메모리 시스템
한 레딧 사용자가 네 개의 마크다운 파일을 활용한 실용적인 메모리 시스템을 공유합니다: USER.md는 정체성, CONTEXT.md는 현재 작업, MEMORY.md는 구조화된 주제, ARCHIVE.md는 완료된 항목을 담습니다. 이 접근법은 더 많은 메모리가 아닌 더 나은 파일 구조를 통해 '에이전트가 자신이 아는 것을 모른다'는 문제를 해결합니다.