Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines

✍️ OpenClawRadar📅 Veröffentlicht: 11. März 2026🔗 Source

Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines

Ad

Was es tut

Ein struktureller Halluzinationsprüfer, der speziell für KI-Agenten-Pipelines entwickelt wurde. Im Gegensatz zur Wahrheitsprüfung konzentriert sich dieses Tool darauf, strukturelle Fehler zu erkennen, die nachgelagerte Tools beeinträchtigen.

Problem, das es löst

Die meisten Agentenprobleme sind keine faktischen Fehler, sondern strukturelle Probleme wie:

Das Modell erfindet ein Feld in einer JSON-Tool-Antwort
Zitieren einer Quelle, die nicht im abgerufenen Datensatz enthalten war
Prompt-Injection, die in abgerufenen Inhalten versteckt ist
Behaupten, ein Tool habe etwas zurückgegeben, was es nicht tat

Vier Unterdrücker

Das Tool enthält vier in Claude Code integrierte Unterdrücker, die als einzelner Schritt laufen, bevor die Agentenausgabe die Benutzer erreicht:

grounding_enforcer - prüft, ob die Modellausgabe tatsächlich durch die übergebenen Quellen unterstützt wird
prompt_suppressor - erkennt Injektionsversuche in abgerufenen Inhalten und Tool-Ergebnissen
json_suppressor - validiert strukturierte Tool-Antworten gegen erwartete Schemata
tool_response_suppressor - markiert, wenn die behauptete Ausgabe eines Tools nicht mit dem übereinstimmt, was es zurückgegeben hat

Ad

Verfügbarkeit

Das Tool ist in zwei Formaten verfügbar:

Eine REST-API
Ein MCP-Server (funktioniert mit Claude Desktop, Cursor, Windsurf usw.)

Der kostenlose Tarif bietet 500 Anfragen/Monat ohne Kreditkarte.

Source und Dokumentation

GitHub-Repository: https://github.com/steveswain14/mcp-hallucination-suite

API und Dokumentation: https://certifai.dev

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Werld: Offene künstliche Lebenssimulation mit sich entwickelnden neuronalen Netzen

Werld: Offene künstliche Lebenssimulation mit sich entwickelnden neuronalen Netzen

Werld ist eine Echtzeit-Simulation künstlichen Lebens, bei der Agenten mit NEAT-Neuronalen Netzen ihre eigene neuronale Architektur, sensorische Verarbeitung und Verhaltensweisen entwickeln, ohne fest kodierte Regeln oder Belohnungsfunktionen. Die Simulation beginnt mit 30 Agenten auf einem Watts-Strogatz-Kleinstwelt-Graphen mit 64 sensorischen Kanälen, 7 kontinuierlichen Motorfunktionen und 29 vererbbaren Genommerkmalen.

1. März 2026, 01:45 UTC

MetaBot: Open-Source-Brücke verbindet Claude-Code mit Telegram, Feishu und WeChat

MetaBot: Open-Source-Brücke verbindet Claude-Code mit Telegram, Feishu und WeChat

MetaBot ist eine Open-Source-TypeScript-Brücke, die das Claude Code Agent SDK mit Messaging-Plattformen wie Telegram, Feishu und WeChat verbindet. Es bietet persistenten Speicher, geplante Aufgaben, Multi-Agenten-Kollaboration und Echtzeit-Streaming von Tool-Aufrufen.

28. März 2026, 18:45 UTC

Skill Studio: Open-Source Desktop-App zur Verwaltung von Claude AI Agent Skills

Skill Studio: Open-Source Desktop-App zur Verwaltung von Claude AI Agent Skills

Skill Studio ist eine kostenlose, quelloffene macOS-Desktop-App, die Entwicklern ermöglicht, Community-Skill-Repositories zu durchsuchen, Dokumentation mit Markdown-Rendering in der Vorschau anzuzeigen und Skills mit einem Klick über Befehle wie npx skills add zu installieren.

16. Apr. 2026, 18:45 UTC

Mymir: Ein Open-Source-Projektgraph für Codierungsagenten via MCP

Mymir: Ein Open-Source-Projektgraph für Codierungsagenten via MCP

Mymir gibt Agenten eine graphbasierte Projektlandkarte mit Abhängigkeiten, Entscheidungen, Akzeptanzkriterien und früheren Ausführungsnotizen, die über MCP bereitgestellt werden, um das wiederholte Erklären des Zustands zwischen Sitzungen zu vermeiden.

30. Apr. 2026, 02:19 UTC