Kelet: Automatisierte Root-Cause-Analyse für KI-Agenten

Was Kelet leistet
Kelet ist ein Dienst, der KI-Agenten und LLM-Anwendungen in der Produktion kontinuierlich überwacht, um automatisch zu ermitteln, warum sie scheitern. Anstatt mit klaren Fehlern abzustürzen, geben Agenten oft stillschweigend falsche Antworten, was eine manuelle Trace-Analyse erfordert. Kelet automatisiert diese Untersuchung, indem es Fehlermuster über Tausende von Sitzungen hinweg clustert.
Wie es funktioniert
- Sie verbinden Ihre Traces und Signale (Nutzerfeedback, Bearbeitungen, Klicks, Stimmung, LLM-als-Richter usw.)
- Kelet verarbeitet diese Signale und extrahiert Fakten zu jeder Sitzung
- Es bildet Hypothesen darüber, was in jedem Fall schiefgelaufen ist
- Es clustert ähnliche Hypothesen über Sitzungen hinweg und untersucht sie gemeinsam
- Es zeigt eine Ursache mit einem vorgeschlagenen Fix an, den Sie prüfen und anwenden können
Die zentrale Erkenntnis: Einzelne Sitzungsfehler wirken zufällig, aber wenn man die Hypothesen clustert, treten Fehlermuster hervor.
Integrationsoptionen
Drei Integrationsmöglichkeiten:
- Kelet Skill für Coding-Agenten: Durchsucht Ihre Codebasis, ermittelt, wo Signale gesammelt werden sollten, und richtet alles automatisch ein
- Python SDK:
pip install kelet - TypeScript SDK:
npm install kelet
Die manuelle Einrichtung erfordert das Hinzufügen von zwei Zeilen zu Ihrem Agenten-Code. Kelet ist vollständig OpenTelemetry-konform, sodass jeder OTEL-instrumentierte Agent sofort funktioniert.
Unterstützte Frameworks und Plattformen
Funktioniert mit: OpenTelemetry, Langfuse, Mixpanel, OpenAI, Anthropic, LangChain, pydantic AI SDK, CrewAI, Strands, Agno, Mastra, PostHog, LangGraph, AutoGen, LlamaIndex, Haystack, Semantic Kernel und Gemini APIs.
Funktioniert mit jedem Agenten oder jeder LLM-Anwendung, bei der Sie den Code besitzen: agentische Schleifen, mehrstufige Workflows, RAG-Pipelines, Chatbots, autonome Agenten.
Zwei Situationen, in denen Kelet nicht passt:
- Wenn Sie KI-Tools von anderen nutzen (Cursor, Claude Code, Copilot als Entwickler)
- Wenn Sie eine Skill oder ein Plugin innerhalb einer bestehenden agentischen Plattform entwickeln
Technische Details
- Läuft auf Kelets Servern (SOC 2 zertifiziert)
- Nimmt kontinuierlich Traces rund um die Uhr auf
- LLM-Tokens für die Analyse werden von Kelet übernommen (berühren nicht Ihre Modell-API-Rechnung)
- Preise basieren auf der Nutzung (siehe kelet.ai/pricing)
- Derzeit während der Beta kostenlos (keine Kreditkarte erforderlich)
Leistungsmetriken
Aus Pilotkohortendaten:
- 73 % der Teams hatten Fehler, die niemand bemerkte (Kelet fand sie)
- 14,3 Minuten mediane Zeit von der Trace-Aufnahme bis zum Prompt-Patch
- 33.000+ Sitzungen analysiert über Design-Partner-Bereitstellungen hinweg
📖 Read the full source: HN AI Agents
👀 Siehe auch

Corbell: Open Source CLI für architekturübergreifende Analyse und Design-Dokumentation über mehrere Repositories hinweg
Corbell ist ein kostenloses, quelloffenes CLI-Tool, das mehrere Repositorys scannt, um einen Architektur-Graphen zu erstellen und Design-Dokumentation lokal zu generieren. Es funktioniert vollständig offline mit Ollama oder unterstützt verschiedene LLM-Anbieter und sendet niemals Code von Ihrem Rechner.

InsForge: Eine Backend-Semantikschicht für Claude Code Agents
InsForge stellt sechs Backend-Primitive bereit – Authentifizierung, Postgres-Datenbank, S3-kompatiblen Speicher, Edge-/Serverless-Funktionen, Model-Gateway und Site-Deployment – als strukturierte Komponenten dar, die Claude Code-Agenten über MCP inspizieren und konfigurieren können, anstatt API-Integrationen erraten zu müssen.

Mnemos: ein MCP-Server für dauerhafte Claude-Code-Speicherung
Mnemos ist ein Open-Source-MCP-Server, der Claude Code dauerhaften Speicher über Sitzungen hinweg bietet, Korrekturen als strukturierte Muster aufzeichnet und beim Start kontextuelle Prioritäten bereitstellt. Ein einziges 15 MB großes Go-Binary, kein Docker oder Vektor-DB erforderlich.

RouteLLM-Einrichtung für kosteneffizientes KI-Aufgaben-Routing
Ein Reddit-Nutzer teilt eine Docker Compose-Konfiguration, die Ollamas lokales Qwen3.5:4b-Modell mit GitHub Copilot über OpenWire kombiniert, wobei RouteLLM komplexe Aufgaben an GPT-4o weiterleitet und einfachere Aufgaben lokal verarbeitet.