Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines

Was es tut
Ein struktureller Halluzinationsprüfer, der speziell für KI-Agenten-Pipelines entwickelt wurde. Im Gegensatz zur Wahrheitsprüfung konzentriert sich dieses Tool darauf, strukturelle Fehler zu erkennen, die nachgelagerte Tools beeinträchtigen.
Problem, das es löst
Die meisten Agentenprobleme sind keine faktischen Fehler, sondern strukturelle Probleme wie:
- Das Modell erfindet ein Feld in einer JSON-Tool-Antwort
- Zitieren einer Quelle, die nicht im abgerufenen Datensatz enthalten war
- Prompt-Injection, die in abgerufenen Inhalten versteckt ist
- Behaupten, ein Tool habe etwas zurückgegeben, was es nicht tat
Vier Unterdrücker
Das Tool enthält vier in Claude Code integrierte Unterdrücker, die als einzelner Schritt laufen, bevor die Agentenausgabe die Benutzer erreicht:
grounding_enforcer- prüft, ob die Modellausgabe tatsächlich durch die übergebenen Quellen unterstützt wirdprompt_suppressor- erkennt Injektionsversuche in abgerufenen Inhalten und Tool-Ergebnissenjson_suppressor- validiert strukturierte Tool-Antworten gegen erwartete Schematatool_response_suppressor- markiert, wenn die behauptete Ausgabe eines Tools nicht mit dem übereinstimmt, was es zurückgegeben hat
Verfügbarkeit
Das Tool ist in zwei Formaten verfügbar:
- Eine REST-API
- Ein MCP-Server (funktioniert mit Claude Desktop, Cursor, Windsurf usw.)
Der kostenlose Tarif bietet 500 Anfragen/Monat ohne Kreditkarte.
Source und Dokumentation
GitHub-Repository: https://github.com/steveswain14/mcp-hallucination-suite
API und Dokumentation: https://certifai.dev
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Werld: Offene künstliche Lebenssimulation mit sich entwickelnden neuronalen Netzen
Werld ist eine Echtzeit-Simulation künstlichen Lebens, bei der Agenten mit NEAT-Neuronalen Netzen ihre eigene neuronale Architektur, sensorische Verarbeitung und Verhaltensweisen entwickeln, ohne fest kodierte Regeln oder Belohnungsfunktionen. Die Simulation beginnt mit 30 Agenten auf einem Watts-Strogatz-Kleinstwelt-Graphen mit 64 sensorischen Kanälen, 7 kontinuierlichen Motorfunktionen und 29 vererbbaren Genommerkmalen.

MetaBot: Open-Source-Brücke verbindet Claude-Code mit Telegram, Feishu und WeChat
MetaBot ist eine Open-Source-TypeScript-Brücke, die das Claude Code Agent SDK mit Messaging-Plattformen wie Telegram, Feishu und WeChat verbindet. Es bietet persistenten Speicher, geplante Aufgaben, Multi-Agenten-Kollaboration und Echtzeit-Streaming von Tool-Aufrufen.

Skill Studio: Open-Source Desktop-App zur Verwaltung von Claude AI Agent Skills
Skill Studio ist eine kostenlose, quelloffene macOS-Desktop-App, die Entwicklern ermöglicht, Community-Skill-Repositories zu durchsuchen, Dokumentation mit Markdown-Rendering in der Vorschau anzuzeigen und Skills mit einem Klick über Befehle wie npx skills add zu installieren.

Mymir: Ein Open-Source-Projektgraph für Codierungsagenten via MCP
Mymir gibt Agenten eine graphbasierte Projektlandkarte mit Abhängigkeiten, Entscheidungen, Akzeptanzkriterien und früheren Ausführungsnotizen, die über MCP bereitgestellt werden, um das wiederholte Erklären des Zustands zwischen Sitzungen zu vermeiden.