Utiliser Claude Haiku comme portier pour réduire les coûts de l'API Sonnet de 80 %

Un développeur a partagé une méthode économique pour traiter de grands volumes de texte non structuré via les modèles Claude AI. L'approche utilise Claude Haiku comme gardien pour filtrer le contenu non pertinent avant d'envoyer uniquement les données utiles au modèle plus coûteux Claude Sonnet.
Le problème et la solution
Le développeur a créé une plateforme appelée PainSignal (painsignal.net) qui extrait des milliers de commentaires réels de travailleurs et de propriétaires d'entreprises de différents secteurs, puis les classe en idées d'applications structurées. La plupart des entrées étaient inutiles — des commentaires comme "super vidéo" ou "premier" ou du bruit aléatoire. Envoyer tout cela à Sonnet serait extrêmement coûteux.
Le pipeline en deux étapes
Étape 1 — Haiku comme gardien : Chaque commentaire passe d'abord par Haiku avec une instruction simple : "Ce commentaire contient-il une véritable frustration, plainte ou besoin non satisfait lié au travail de quelqu'un ?" Il renvoie un oui/non et un score de confiance. Cela coûte des fractions de centime par appel et filtre environ 85 % des entrées.
Étape 2 — Sonnet pour le vrai travail : Seuls les commentaires qui passent le gardien sont envoyés à Sonnet. C'est là que le traitement coûteux a lieu — il extrait le problème central, le classe par secteur et catégorie (pas de liste prédéfinie, il construit la taxonomie dynamiquement), attribue un score de gravité et génère des concepts d'applications avec des fonctionnalités et des modèles de revenus.
Résultats et détails de mise en œuvre
Le résultat est l'exécution de Sonnet sur environ 15 % des entrées totales au lieu de 100 %, ce qui génère d'importantes économies lors du traitement de milliers de commentaires.
Principaux enseignements de la mise en œuvre :
- Haiku est étonnamment efficace comme gardien — il identifie systématiquement les vraies plaintes avec peu de faux négatifs
- L'approche de taxonomie dynamique (laisser Sonnet décider des catégories plutôt que de les définir à l'avance) a révélé des catégories auxquelles le développeur n'aurait jamais pensé
- Le traitement par lots aide du côté Sonnet — tout est mis en file d'attente via BullMQ et traité par lots contrôlés pour éviter de surcharger l'API
L'ensemble du système a été construit avec Claude Code en utilisant Next.js, Postgres avec pgvector et des technologies associées.
📖 Read the full source: r/ClaudeAI
👀 See Also

Utiliser Claude pour construire PainSignal : une base de données de 1 000 problèmes commerciaux réels
Un développeur a utilisé Claude Code pour créer PainSignal, une plateforme qui organise 1 000 problèmes réels d'entreprises provenant de secteurs comme le transport routier et le nettoyage. Claude a géré la classification des données, le regroupement des opportunités et la génération de concepts d'applications.

Un non-développeur crée une application iOS avec Claude en un an : retours d'expérience pratiques
Une personne non-développeuse sans aucune expérience en logiciel a créé BloomDay, une application iOS complète de productivité en utilisant Claude pendant plus d'un an. L'application inclut le suivi des tâches, le suivi des habitudes, un mode concentration avec des sons ambiants et un jardin virtuel, développée avec React Native et Expo.

Exécuter OpenClaw localement avec Jetson Nano et un ordinateur portable de jeu en utilisant Ollama
Un développeur a configuré OpenClaw pour fonctionner localement en utilisant un Jetson Nano et un ordinateur portable de jeu MSI 2022 avec Qwen 3.5 9B via Ollama, en mettant en œuvre le réveil par réseau (wake-on-LAN) pour l'efficacité énergétique et le routage hybride vers OpenAI pour les tâches complexes.

Développeur Crée un Jeu de Combat de Cartes en 72 Heures avec Claude AI
Un développeur a utilisé Claude IA pour créer un jeu de combat par cartes complet en navigateur appelé SNAPDOWN en 72 heures. Le jeu comprend une histoire en 6 étapes, 4 classes jouables avec des mécaniques uniques, des adversaires IA, des animations et un système de tutoriel — le tout dans un seul fichier HTML sans framework ni étape de compilation.