Kelet: Automatisierte Root-Cause-Analyse für KI-Agenten

Was Kelet leistet
Kelet ist ein Dienst, der KI-Agenten und LLM-Anwendungen in der Produktion kontinuierlich überwacht, um automatisch zu ermitteln, warum sie scheitern. Anstatt mit klaren Fehlern abzustürzen, geben Agenten oft stillschweigend falsche Antworten, was eine manuelle Trace-Analyse erfordert. Kelet automatisiert diese Untersuchung, indem es Fehlermuster über Tausende von Sitzungen hinweg clustert.
Wie es funktioniert
- Sie verbinden Ihre Traces und Signale (Nutzerfeedback, Bearbeitungen, Klicks, Stimmung, LLM-als-Richter usw.)
- Kelet verarbeitet diese Signale und extrahiert Fakten zu jeder Sitzung
- Es bildet Hypothesen darüber, was in jedem Fall schiefgelaufen ist
- Es clustert ähnliche Hypothesen über Sitzungen hinweg und untersucht sie gemeinsam
- Es zeigt eine Ursache mit einem vorgeschlagenen Fix an, den Sie prüfen und anwenden können
Die zentrale Erkenntnis: Einzelne Sitzungsfehler wirken zufällig, aber wenn man die Hypothesen clustert, treten Fehlermuster hervor.
Integrationsoptionen
Drei Integrationsmöglichkeiten:
- Kelet Skill für Coding-Agenten: Durchsucht Ihre Codebasis, ermittelt, wo Signale gesammelt werden sollten, und richtet alles automatisch ein
- Python SDK:
pip install kelet - TypeScript SDK:
npm install kelet
Die manuelle Einrichtung erfordert das Hinzufügen von zwei Zeilen zu Ihrem Agenten-Code. Kelet ist vollständig OpenTelemetry-konform, sodass jeder OTEL-instrumentierte Agent sofort funktioniert.
Unterstützte Frameworks und Plattformen
Funktioniert mit: OpenTelemetry, Langfuse, Mixpanel, OpenAI, Anthropic, LangChain, pydantic AI SDK, CrewAI, Strands, Agno, Mastra, PostHog, LangGraph, AutoGen, LlamaIndex, Haystack, Semantic Kernel und Gemini APIs.
Funktioniert mit jedem Agenten oder jeder LLM-Anwendung, bei der Sie den Code besitzen: agentische Schleifen, mehrstufige Workflows, RAG-Pipelines, Chatbots, autonome Agenten.
Zwei Situationen, in denen Kelet nicht passt:
- Wenn Sie KI-Tools von anderen nutzen (Cursor, Claude Code, Copilot als Entwickler)
- Wenn Sie eine Skill oder ein Plugin innerhalb einer bestehenden agentischen Plattform entwickeln
Technische Details
- Läuft auf Kelets Servern (SOC 2 zertifiziert)
- Nimmt kontinuierlich Traces rund um die Uhr auf
- LLM-Tokens für die Analyse werden von Kelet übernommen (berühren nicht Ihre Modell-API-Rechnung)
- Preise basieren auf der Nutzung (siehe kelet.ai/pricing)
- Derzeit während der Beta kostenlos (keine Kreditkarte erforderlich)
Leistungsmetriken
Aus Pilotkohortendaten:
- 73 % der Teams hatten Fehler, die niemand bemerkte (Kelet fand sie)
- 14,3 Minuten mediane Zeit von der Trace-Aufnahme bis zum Prompt-Patch
- 33.000+ Sitzungen analysiert über Design-Partner-Bereitstellungen hinweg
📖 Read the full source: HN AI Agents
👀 Siehe auch

Claude Code Auto-Modus: Eine sicherere Alternative zum Überspringen von Berechtigungen
Claude Code bietet jetzt den Automodus, einen Berechtigungsmodus, in dem Claude Berechtigungsentscheidungen trifft, während Sicherheitsvorkehrungen Aktionen vor der Ausführung überwachen. Er ist als Forschungsvorschau für Team-Plan-Nutzer verfügbar, mit einer Veröffentlichung für Enterprise und API in Kürze.

Relay: Ein Tool zur Übergabe von Claude-Code-Sitzungen an andere KI-Agenten
Relay ist ein Rust-Binary, das den Sitzungskontext von Claude Code extrahiert – einschließlich Gesprächsverlauf, Tool-Aufrufe, Fehler und Git-Status – und ihn an andere KI-Agenten wie Codex oder Gemini weitergibt, wenn Ratenlimits erreicht werden. Es unterstützt 8 Agenten und kann über GitHub oder npm installiert werden.

Krasis: Hybride CPU/GPU-Laufzeitumgebung für große MoE-Modelle erreicht 3.324 Tok/s Prefill auf RTX 5080
Krasis ist eine hybride CPU/GPU-Laufzeitumgebung, die große MoE-Modelle ausführt, indem sie die Vorausfüllung auf der GPU und die Dekodierung auf der CPU verarbeitet. Sie erreicht 3.324 Token/Sekunde bei der Vorausfüllung auf einer RTX 5080 mit Qwen3-Coder-Next 80B Q4. Sie benötigt etwa das 2,5-fache der Modellgröße im System-RAM, ermöglicht aber die Ausführung von Modellen, die für den VRAM zu groß sind.

IronBee: Open-Source-Verifizierungsschicht für Claude Code und Cursor
IronBee ist eine Open-Source-Verifizierungsschicht, die KI-Codierungsagenten zwingt, Änderungen in einem echten Browser zu testen, bevor sie Aufgaben abschließen. In Tests fing sie in 82 % der Claude-Code-Sitzungen Fehler ab, die ohne Verifizierung ausgeliefert worden wären.