Kelet: Automatisierte Root-Cause-Analyse für KI-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 17. April 2026🔗 Source
Kelet: Automatisierte Root-Cause-Analyse für KI-Agenten
Ad

Was Kelet leistet

Kelet ist ein Dienst, der KI-Agenten und LLM-Anwendungen in der Produktion kontinuierlich überwacht, um automatisch zu ermitteln, warum sie scheitern. Anstatt mit klaren Fehlern abzustürzen, geben Agenten oft stillschweigend falsche Antworten, was eine manuelle Trace-Analyse erfordert. Kelet automatisiert diese Untersuchung, indem es Fehlermuster über Tausende von Sitzungen hinweg clustert.

Wie es funktioniert

  • Sie verbinden Ihre Traces und Signale (Nutzerfeedback, Bearbeitungen, Klicks, Stimmung, LLM-als-Richter usw.)
  • Kelet verarbeitet diese Signale und extrahiert Fakten zu jeder Sitzung
  • Es bildet Hypothesen darüber, was in jedem Fall schiefgelaufen ist
  • Es clustert ähnliche Hypothesen über Sitzungen hinweg und untersucht sie gemeinsam
  • Es zeigt eine Ursache mit einem vorgeschlagenen Fix an, den Sie prüfen und anwenden können

Die zentrale Erkenntnis: Einzelne Sitzungsfehler wirken zufällig, aber wenn man die Hypothesen clustert, treten Fehlermuster hervor.

Integrationsoptionen

Drei Integrationsmöglichkeiten:

  • Kelet Skill für Coding-Agenten: Durchsucht Ihre Codebasis, ermittelt, wo Signale gesammelt werden sollten, und richtet alles automatisch ein
  • Python SDK: pip install kelet
  • TypeScript SDK: npm install kelet

Die manuelle Einrichtung erfordert das Hinzufügen von zwei Zeilen zu Ihrem Agenten-Code. Kelet ist vollständig OpenTelemetry-konform, sodass jeder OTEL-instrumentierte Agent sofort funktioniert.

Ad

Unterstützte Frameworks und Plattformen

Funktioniert mit: OpenTelemetry, Langfuse, Mixpanel, OpenAI, Anthropic, LangChain, pydantic AI SDK, CrewAI, Strands, Agno, Mastra, PostHog, LangGraph, AutoGen, LlamaIndex, Haystack, Semantic Kernel und Gemini APIs.

Funktioniert mit jedem Agenten oder jeder LLM-Anwendung, bei der Sie den Code besitzen: agentische Schleifen, mehrstufige Workflows, RAG-Pipelines, Chatbots, autonome Agenten.

Zwei Situationen, in denen Kelet nicht passt:

  • Wenn Sie KI-Tools von anderen nutzen (Cursor, Claude Code, Copilot als Entwickler)
  • Wenn Sie eine Skill oder ein Plugin innerhalb einer bestehenden agentischen Plattform entwickeln

Technische Details

  • Läuft auf Kelets Servern (SOC 2 zertifiziert)
  • Nimmt kontinuierlich Traces rund um die Uhr auf
  • LLM-Tokens für die Analyse werden von Kelet übernommen (berühren nicht Ihre Modell-API-Rechnung)
  • Preise basieren auf der Nutzung (siehe kelet.ai/pricing)
  • Derzeit während der Beta kostenlos (keine Kreditkarte erforderlich)

Leistungsmetriken

Aus Pilotkohortendaten:

  • 73 % der Teams hatten Fehler, die niemand bemerkte (Kelet fand sie)
  • 14,3 Minuten mediane Zeit von der Trace-Aufnahme bis zum Prompt-Patch
  • 33.000+ Sitzungen analysiert über Design-Partner-Bereitstellungen hinweg

📖 Read the full source: HN AI Agents

Ad

👀 Siehe auch

Claude Code Auto-Modus: Eine sicherere Alternative zum Überspringen von Berechtigungen
Werkzeuge

Claude Code Auto-Modus: Eine sicherere Alternative zum Überspringen von Berechtigungen

Claude Code bietet jetzt den Automodus, einen Berechtigungsmodus, in dem Claude Berechtigungsentscheidungen trifft, während Sicherheitsvorkehrungen Aktionen vor der Ausführung überwachen. Er ist als Forschungsvorschau für Team-Plan-Nutzer verfügbar, mit einer Veröffentlichung für Enterprise und API in Kürze.

OpenClawRadar
Relay: Ein Tool zur Übergabe von Claude-Code-Sitzungen an andere KI-Agenten
Werkzeuge

Relay: Ein Tool zur Übergabe von Claude-Code-Sitzungen an andere KI-Agenten

Relay ist ein Rust-Binary, das den Sitzungskontext von Claude Code extrahiert – einschließlich Gesprächsverlauf, Tool-Aufrufe, Fehler und Git-Status – und ihn an andere KI-Agenten wie Codex oder Gemini weitergibt, wenn Ratenlimits erreicht werden. Es unterstützt 8 Agenten und kann über GitHub oder npm installiert werden.

OpenClawRadar
Krasis: Hybride CPU/GPU-Laufzeitumgebung für große MoE-Modelle erreicht 3.324 Tok/s Prefill auf RTX 5080
Werkzeuge

Krasis: Hybride CPU/GPU-Laufzeitumgebung für große MoE-Modelle erreicht 3.324 Tok/s Prefill auf RTX 5080

Krasis ist eine hybride CPU/GPU-Laufzeitumgebung, die große MoE-Modelle ausführt, indem sie die Vorausfüllung auf der GPU und die Dekodierung auf der CPU verarbeitet. Sie erreicht 3.324 Token/Sekunde bei der Vorausfüllung auf einer RTX 5080 mit Qwen3-Coder-Next 80B Q4. Sie benötigt etwa das 2,5-fache der Modellgröße im System-RAM, ermöglicht aber die Ausführung von Modellen, die für den VRAM zu groß sind.

OpenClawRadar
IronBee: Open-Source-Verifizierungsschicht für Claude Code und Cursor
Werkzeuge

IronBee: Open-Source-Verifizierungsschicht für Claude Code und Cursor

IronBee ist eine Open-Source-Verifizierungsschicht, die KI-Codierungsagenten zwingt, Änderungen in einem echten Browser zu testen, bevor sie Aufgaben abschließen. In Tests fing sie in 82 % der Claude-Code-Sitzungen Fehler ab, die ohne Verifizierung ausgeliefert worden wären.

OpenClawRadar