Kelet : Analyse Automatisée des Causes Racines pour Agents IA

Ce que fait Kelet
Kelet est un service qui surveille en continu les agents d'IA et les applications LLM en production pour identifier automatiquement pourquoi ils échouent. Au lieu de planter avec des erreurs claires, les agents donnent souvent des réponses incorrectes silencieusement, nécessitant une analyse manuelle des traces. Kelet automatise cette investigation en regroupant les modèles de défaillance à travers des milliers de sessions.
Comment ça fonctionne
- Vous connectez vos traces et signaux (retours utilisateurs, modifications, clics, sentiment, LLM-comme-juge, etc.)
- Kelet traite ces signaux et extrait des faits sur chaque session
- Il formule des hypothèses sur ce qui a mal tourné dans chaque cas
- Il regroupe les hypothèses similaires entre les sessions et les étudie ensemble
- Il révèle une cause racine avec un correctif suggéré que vous pouvez examiner et appliquer
L'idée clé : les défaillances individuelles semblent aléatoires, mais lorsque vous regroupez les hypothèses, des modèles d'échec émergent.
Options d'intégration
Trois façons de s'intégrer :
- Compétence Kelet pour les agents de codage : Analyse votre base de code, découvre où les signaux doivent être collectés et configure tout automatiquement
- SDK Python :
pip install kelet - SDK TypeScript :
npm install kelet
La configuration manuelle nécessite d'ajouter deux lignes à votre code d'agent. Kelet est entièrement conforme à OpenTelemetry, donc tout agent instrumenté OTEL fonctionne immédiatement.
Frameworks et plates-formes pris en charge
Fonctionne avec : OpenTelemetry, Langfuse, Mixpanel, OpenAI, Anthropic, LangChain, pydantic AI SDK, CrewAI, Strands, Agno, Mastra, PostHog, LangGraph, AutoGen, LlamaIndex, Haystack, Semantic Kernel, et les API Gemini.
Fonctionne avec n'importe quel agent ou application LLM dont vous possédez le code : boucles agentiques, workflows multi-étapes, pipelines RAG, chatbots, agents autonomes.
Deux situations où Kelet n'est pas adapté :
- Si vous utilisez des outils d'IA construits par d'autres (Cursor, Claude Code, Copilot en tant que développeur)
- Si vous construisez une compétence ou un plugin à l'intérieur d'une plate-forme agentique existante
Détails techniques
- S'exécute sur les serveurs de Kelet (certifié SOC 2)
- Ingère continuellement les traces 24h/24 et 7j/7
- Les tokens LLM pour l'analyse sont couverts par Kelet (n'affecte pas votre facture d'API de modèle)
- Tarification basée sur l'utilisation (voir kelet.ai/pricing)
- Actuellement gratuit pendant la phase bêta (aucune carte de crédit requise)
Métriques de performance
D'après les données de la cohorte pilote :
- 73% des équipes avaient des défaillances que personne n'avait remarquées (Kelet les a trouvées)
- 14,3 minutes de temps médian entre l'ingestion des traces et le correctif de prompt
- 33 000+ sessions analysées dans les déploiements des partenaires de conception
📖 Read the full source: HN AI Agents
👀 See Also

Zikra : Serveur de mémoire MCP auto-hébergé pour Claude Code, Cursor et Codex
Zikra est un serveur de mémoire MCP auto-hébergé qui enregistre automatiquement chaque décision, erreur et exigence à la fin des sessions Claude Code via un crochet d'arrêt, créant un pool de mémoire partagé accessible à travers les outils et les membres de l'équipe.

Profil de Coût des LLM : Un outil open source qui suit les dépenses d'API pour justifier les modèles locaux.
LLM Cost Profiler est un outil Python qui suit chaque appel API vers OpenAI/Anthropic, montrant précisément ce que vous dépensez et où. Il révèle les tâches surévaluées par rapport à leur complexité, fournissant des montants en dollars concrets pour justifier le passage à des modèles locaux.

Personnaliser Claude IA pour un retour amélioré
Ajustez les paramètres de Claude IA pour éviter un accord excessif et favoriser une réflexion plus critique et des retours plus pratiques.

Objectif pour Claude Code : tâches persistantes avec examen contradictoire
Une commande /goal pour Claude Code qui le maintient sur une tâche longue à travers de nombreux tours, avec une session Claude distincte et facultative qui examine le résultat final pour éviter une complétion prématurée.