Construire une plateforme d'agents IA serverless sur AWS pour 0,01 $/mois avec Claude Code

✍️ OpenClawRadar📅 Publié: March 29, 2026🔗 Source
Construire une plateforme d'agents IA serverless sur AWS pour 0,01 $/mois avec Claude Code
Ad

Vue d'ensemble du projet

Serverless OpenClaw est une plateforme d'agents IA serverless full-stack entièrement construite via des invites conversationnelles à Claude Code sur 29 heures réparties sur 5 semaines. La plateforme exécute l'agent IA OpenClaw à la demande sur AWS avec une interface web de chat React et un bot Telegram, déployant toute l'infrastructure avec une seule commande cdk deploy.

Détails techniques

Optimisation des coûts : Le projet a réduit les coûts mensuels d'une configuration serverless typique d'environ 70 $+ à 0,01 $/mois sur Lambda avec zéro coût d'inactivité. Les éliminations spécifiques incluent :

  • NAT Gateway : -32 $/mois
  • ALB (Application Load Balancer) : -18 $/mois
  • Fargate toujours actif : -15 $/mois
  • Interface VPC Endpoints : -7 $/mois chacun
  • DynamoDB provisionné : Économies variables

Métriques de performance :

  • Démarrage à froid : 1,35 s (Lambda), 0,12 s à chaud
  • Coût total AWS pendant le développement : ~0,25 $
  • Coût mensuel d'exécution : ~0,01 $ (Lambda)

Qualité du code :

  • Tests unitaires : 233
  • Tests E2E : 35
  • Piles CDK : 8
  • Packages TypeScript : 6 (monorepo)

Processus de développement

L'ensemble du projet a été construit sans codage manuel – uniquement des invites, des revues et des corrections de trajectoire. Claude Code a été utilisé pour :

  • Conception de l'architecture : « Concevez une plateforme serverless coûtant moins de 1 $/mois » → Claude Code a produit le PRD, les piles CDK, la conception réseau
  • Workflow TDD : Claude Code a écrit les tests d'abord, puis l'implémentation (233 tests avant un seul déploiement)
  • Sessions de débogage : Échecs de build Docker, optimisation du démarrage à froid (68 s → 1,35 s), problèmes d'authentification WebSocket
  • Migration Phase 2 : Passage de Fargate à Lambda Container Image en cours de projet, incluant la persistance de session S3 et le routage intelligent

Les invites étaient à l'origine en coréen, et Claude Code a géré le développement bilingue de manière transparente.

Ad

Stack technologique

Monorepo TypeScript (6 packages) sur AWS utilisant : CDK pour l'IaC, API Gateway (WebSocket + REST), Lambda + Fargate Spot pour le calcul, DynamoDB, S3, authentification Cognito, CloudFront + SPA React, Telegram Bot API. Support multi-LLM via Anthropic API et Amazon Bedrock.

Modèles pratiques

API Gateway au lieu d'ALB : Économise 18 $+/mois. WebSocket + REST sur API Gateway avec gestionnaires Lambda.

Structure du tutoriel

Le tutoriel « vibe coding » en 7 chapitres documente chaque invite, échec et correction :

  • Chapitre 1 : Le défi du 1 $/mois (~2 h) – PRD, conception d'architecture, analyse des coûts
  • Chapitre 2 : MVP en un week-end (~8 h) – Phase 1 en 10 étapes, piles CDK, TDD
  • Chapitre 3 : Réalité du déploiement (~4 h) – Docker, secrets, authentification, premier déploiement réel
  • Chapitre 4 : La bataille du démarrage à froid (~6 h) – Optimisation Docker, réglage CPU, préchauffage
  • Chapitre 5 : Migration Lambda (~4 h) – Phase 2, agent intégré, sessions S3
  • Chapitre 6 : Routage intelligent (~3 h) – Hybride Lambda/Fargate, aperçu du démarrage à froid
  • Chapitre 7 : Automatisation des versions (~2 h) – Compétences, revue parallèle, versions GitHub

Chaque chapitre inclut : l'invite réelle donnée → ce que Claude Code a fait → ce qui a cassé → comment nous avons réparé → leçons apprises → commandes reproductibles.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Stratégies pratiques de codage en IA tirées de 1000 heures d'expérience
Guides

Stratégies pratiques de codage en IA tirées de 1000 heures d'expérience

Un post Reddit décrit des niveaux de prompting spécifiques et des stratégies de flux de travail pour utiliser efficacement les agents d'IA de codage, notamment en traitant l'IA comme un développeur junior, en mettant en œuvre une approche par phases et en utilisant des fichiers d'instructions.

OpenClawRadar
Gestion des Déconnexions de Passerelle pour une Automatisation Efficace
Guides

Gestion des Déconnexions de Passerelle pour une Automatisation Efficace

Découvrez des solutions pratiques pour maintenir les opérations des agents de codage IA face aux déconnexions de passerelle. Les conseils incluent la surveillance avec Grafana, les scripts de reconnexion automatisés et l'utilisation de chemins redondants pour la fiabilité.

OpenClawRadar
Comment les prompts d'évaluation des petits modèles peuvent induire en erreur et comment y remédier
Guides

Comment les prompts d'évaluation des petits modèles peuvent induire en erreur et comment y remédier

Un post sur Reddit explique que les prompts d'évaluation des petits modèles produisent souvent des résultats trompeurs car ils déclenchent les mauvais chemins cognitifs dans les transformateurs, identifiant spécifiquement trois modes distincts : rappel factuel, application/suivi d'instructions, et inférence émotionnelle/empathique.

OpenClawRadar
Dépôt ClaudeBusiness : Modèles pour gérer des entreprises réelles avec Claude Code
Guides

Dépôt ClaudeBusiness : Modèles pour gérer des entreprises réelles avec Claude Code

Un dépôt GitHub rassemblant des modèles pratiques, des frameworks et des garde-fous issus de plus de 35 fils Reddit de fondateurs utilisant Claude pour gérer des agences de services et des entreprises SaaS solo.

OpenClawRadar