Construire une plateforme d'agents IA serverless sur AWS pour 0,01 $/mois avec Claude Code

Vue d'ensemble du projet
Serverless OpenClaw est une plateforme d'agents IA serverless full-stack entièrement construite via des invites conversationnelles à Claude Code sur 29 heures réparties sur 5 semaines. La plateforme exécute l'agent IA OpenClaw à la demande sur AWS avec une interface web de chat React et un bot Telegram, déployant toute l'infrastructure avec une seule commande cdk deploy.
Détails techniques
Optimisation des coûts : Le projet a réduit les coûts mensuels d'une configuration serverless typique d'environ 70 $+ à 0,01 $/mois sur Lambda avec zéro coût d'inactivité. Les éliminations spécifiques incluent :
- NAT Gateway : -32 $/mois
- ALB (Application Load Balancer) : -18 $/mois
- Fargate toujours actif : -15 $/mois
- Interface VPC Endpoints : -7 $/mois chacun
- DynamoDB provisionné : Économies variables
Métriques de performance :
- Démarrage à froid : 1,35 s (Lambda), 0,12 s à chaud
- Coût total AWS pendant le développement : ~0,25 $
- Coût mensuel d'exécution : ~0,01 $ (Lambda)
Qualité du code :
- Tests unitaires : 233
- Tests E2E : 35
- Piles CDK : 8
- Packages TypeScript : 6 (monorepo)
Processus de développement
L'ensemble du projet a été construit sans codage manuel – uniquement des invites, des revues et des corrections de trajectoire. Claude Code a été utilisé pour :
- Conception de l'architecture : « Concevez une plateforme serverless coûtant moins de 1 $/mois » → Claude Code a produit le PRD, les piles CDK, la conception réseau
- Workflow TDD : Claude Code a écrit les tests d'abord, puis l'implémentation (233 tests avant un seul déploiement)
- Sessions de débogage : Échecs de build Docker, optimisation du démarrage à froid (68 s → 1,35 s), problèmes d'authentification WebSocket
- Migration Phase 2 : Passage de Fargate à Lambda Container Image en cours de projet, incluant la persistance de session S3 et le routage intelligent
Les invites étaient à l'origine en coréen, et Claude Code a géré le développement bilingue de manière transparente.
Stack technologique
Monorepo TypeScript (6 packages) sur AWS utilisant : CDK pour l'IaC, API Gateway (WebSocket + REST), Lambda + Fargate Spot pour le calcul, DynamoDB, S3, authentification Cognito, CloudFront + SPA React, Telegram Bot API. Support multi-LLM via Anthropic API et Amazon Bedrock.
Modèles pratiques
API Gateway au lieu d'ALB : Économise 18 $+/mois. WebSocket + REST sur API Gateway avec gestionnaires Lambda.
Structure du tutoriel
Le tutoriel « vibe coding » en 7 chapitres documente chaque invite, échec et correction :
- Chapitre 1 : Le défi du 1 $/mois (~2 h) – PRD, conception d'architecture, analyse des coûts
- Chapitre 2 : MVP en un week-end (~8 h) – Phase 1 en 10 étapes, piles CDK, TDD
- Chapitre 3 : Réalité du déploiement (~4 h) – Docker, secrets, authentification, premier déploiement réel
- Chapitre 4 : La bataille du démarrage à froid (~6 h) – Optimisation Docker, réglage CPU, préchauffage
- Chapitre 5 : Migration Lambda (~4 h) – Phase 2, agent intégré, sessions S3
- Chapitre 6 : Routage intelligent (~3 h) – Hybride Lambda/Fargate, aperçu du démarrage à froid
- Chapitre 7 : Automatisation des versions (~2 h) – Compétences, revue parallèle, versions GitHub
Chaque chapitre inclut : l'invite réelle donnée → ce que Claude Code a fait → ce qui a cassé → comment nous avons réparé → leçons apprises → commandes reproductibles.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Stratégies pratiques de codage en IA tirées de 1000 heures d'expérience
Un post Reddit décrit des niveaux de prompting spécifiques et des stratégies de flux de travail pour utiliser efficacement les agents d'IA de codage, notamment en traitant l'IA comme un développeur junior, en mettant en œuvre une approche par phases et en utilisant des fichiers d'instructions.

Gestion des Déconnexions de Passerelle pour une Automatisation Efficace
Découvrez des solutions pratiques pour maintenir les opérations des agents de codage IA face aux déconnexions de passerelle. Les conseils incluent la surveillance avec Grafana, les scripts de reconnexion automatisés et l'utilisation de chemins redondants pour la fiabilité.

Comment les prompts d'évaluation des petits modèles peuvent induire en erreur et comment y remédier
Un post sur Reddit explique que les prompts d'évaluation des petits modèles produisent souvent des résultats trompeurs car ils déclenchent les mauvais chemins cognitifs dans les transformateurs, identifiant spécifiquement trois modes distincts : rappel factuel, application/suivi d'instructions, et inférence émotionnelle/empathique.

Dépôt ClaudeBusiness : Modèles pour gérer des entreprises réelles avec Claude Code
Un dépôt GitHub rassemblant des modèles pratiques, des frameworks et des garde-fous issus de plus de 35 fils Reddit de fondateurs utilisant Claude pour gérer des agences de services et des entreprises SaaS solo.