IronBee Open-Source: Claude Code Fehler in 82% abfangen

Was IronBee tut

IronBee ist eine Open-Source-Verifizierungsschicht, die Hooks in Claude Code (und funktioniert auch mit Cursor) installiert, um KI-Codierungsagenten daran zu hindern, ungetesteten Code auszuliefern. Das Tool behebt ein häufiges Problem, bei dem Claude Code selbstbewusst behauptet, "Ich habe die Funktion implementiert", ohne zu überprüfen, ob sie im Browser tatsächlich funktioniert.

Hauptfunktionen

Blockiert den Aufgabenabschluss, bis der Agent Änderungen in einem echten Browser testet
Verfolgt jede Dateibearbeitung, Browser-Tool-Aufruf und Verifizierungsversuch
Zwingt den Agenten, strukturierte Urteile abzugeben (nicht nur "sieht gut aus")
Zwingt den Agenten, Fehler zu beheben und erneut zu verifizieren
Verwendet den browser-devtools MCP-Server, damit Claude Code Seiten navigieren, Buttons klicken, Formulare ausfüllen, Screenshots machen und Konsolenfehler überprüfen kann
Enthält /ironbee-verify mit verschiedenen Modi (Standard, Vollständig, Visuell, Funktional)
Enthält /ironbee-analyze für Sitzungsanalysen, die zeigen, wie viel Zeit für Codieren vs. Fehlerbehebung aufgewendet wurde, problematische Dateien und die Verbesserung des Agenten im Laufe der Zeit

Leistungsdaten

Laut der Quelle zeigte die Verfolgung von Sitzungen, dass 82 % Fehler enthielten, die Claude Code ohne Verifizierung ausgeliefert hätte, mit einer Erstpassrate von nur 18 %. In Tests fing und behebt IronBee jeden Fehler, bevor er ausgeliefert wurde.

Einrichtung

Die Installation erfordert zwei Befehle:

npm install -g @ironbee-ai/cli
cd your-project
ironbee install

Source information

Ankündigungs-Blogbeitrag: https://medium.com/@serkan_ozal/introducing-ironbee-the-verification-and-intelligence-layer-for-ai-coding-agents-dd554279efa3

GitHub-Repository: https://github.com/ironbee-ai/ironbee-cli

📖 Read the full source: r/ClaudeAI

IronBee: Open-Source-Verifizierungsschicht für Claude Code und Cursor

Was IronBee tut

Hauptfunktionen

Leistungsdaten

Einrichtung

Source information

👀 Siehe auch

Das Depct-Tool sammelt Laufzeitdaten, um Claude bei der Fehlerbehebung von Produktionsproblemen zu unterstützen.

Lokaler KI-Steuerberater mit verschlüsselten personenbezogenen Daten, basierend auf MCP

Das Snip-Tool ermöglicht visuelle Kommunikation mit KI-Codierungsagenten.

Hubcap Bridge: Persistente bidirektionale Kommunikation zwischen CLI und Browser-JavaScript via CDP