IronBee: Open-Source-Verifizierungsschicht für Claude Code und Cursor

Was IronBee tut
IronBee ist eine Open-Source-Verifizierungsschicht, die Hooks in Claude Code (und funktioniert auch mit Cursor) installiert, um KI-Codierungsagenten daran zu hindern, ungetesteten Code auszuliefern. Das Tool behebt ein häufiges Problem, bei dem Claude Code selbstbewusst behauptet, "Ich habe die Funktion implementiert", ohne zu überprüfen, ob sie im Browser tatsächlich funktioniert.
Hauptfunktionen
- Blockiert den Aufgabenabschluss, bis der Agent Änderungen in einem echten Browser testet
- Verfolgt jede Dateibearbeitung, Browser-Tool-Aufruf und Verifizierungsversuch
- Zwingt den Agenten, strukturierte Urteile abzugeben (nicht nur "sieht gut aus")
- Zwingt den Agenten, Fehler zu beheben und erneut zu verifizieren
- Verwendet den browser-devtools MCP-Server, damit Claude Code Seiten navigieren, Buttons klicken, Formulare ausfüllen, Screenshots machen und Konsolenfehler überprüfen kann
- Enthält
/ironbee-verifymit verschiedenen Modi (Standard, Vollständig, Visuell, Funktional) - Enthält
/ironbee-analyzefür Sitzungsanalysen, die zeigen, wie viel Zeit für Codieren vs. Fehlerbehebung aufgewendet wurde, problematische Dateien und die Verbesserung des Agenten im Laufe der Zeit
Leistungsdaten
Laut der Quelle zeigte die Verfolgung von Sitzungen, dass 82 % Fehler enthielten, die Claude Code ohne Verifizierung ausgeliefert hätte, mit einer Erstpassrate von nur 18 %. In Tests fing und behebt IronBee jeden Fehler, bevor er ausgeliefert wurde.
Einrichtung
Die Installation erfordert zwei Befehle:
npm install -g @ironbee-ai/cli
cd your-project
ironbee installSource information
Ankündigungs-Blogbeitrag: https://medium.com/@serkan_ozal/introducing-ironbee-the-verification-and-intelligence-layer-for-ai-coding-agents-dd554279efa3
GitHub-Repository: https://github.com/ironbee-ai/ironbee-cli
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

llm-use – Ein Open-Source-Rahmenwerk zum Routing und Orchestrieren von Multi-LLM-Agenten-Workflows.
llm-use revolutioniert die Automatisierung mit seinem Open-Source-Framework, das darauf abzielt, Multi-LLM-Agenten-Workflows effizient zu steuern und zu orchestrieren. Entdecken Sie die Auswirkungen auf KI-Operationen.

Open-Source-Auto-Memory-System für LLM-Agenten erreicht 94 % Erinnerungsgenauigkeit
Ein Entwickler hat ein Speicher-Plugin für LLM-basierte Agenten erstellt, das automatisch Fakten über Sitzungen hinweg extrahiert, klassifiziert und speichert, ohne explizite Benutzerbefehle. Das System erreichte 94,2 % Genauigkeit in einem Rückruf-Benchmark mit 52 Prüfpunkten, wobei strukturierte Markdown-Dateien anstelle von Vektordatenbanken verwendet wurden.

Drei MCP-Server für E-Commerce-Recherche mit Claude: Shopify-, Amazon- und Google Maps-Tools
Ein Entwickler hat drei MCP-Server für Claude erstellt, um Shopify-Shops ohne API-Schlüssel zu analysieren, Amazon-Produktchancen zu bewerten und lokale Geschäftskontakte von Google Maps zu finden und zu bewerten. Alle sind auf Apify verfügbar.

Jan fügt Ein-Klick-OpenClaw-Installation mit Jan-v3-Base-Modell-Integration hinzu
Jan unterstützt jetzt die Ein-Klick-Installation von OpenClaw mit direkter Integration in das Jan-v3-Basismodell, wobei alle Vorgänge lokal und privat auf Ihrem Computer bleiben.