Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines

✍️ OpenClawRadar📅 Veröffentlicht: 11. März 2026🔗 Source
Open-Source-Struktur-Halluzinationsprüfer für KI-Agenten-Pipelines
Ad

Was es tut

Ein struktureller Halluzinationsprüfer, der speziell für KI-Agenten-Pipelines entwickelt wurde. Im Gegensatz zur Wahrheitsprüfung konzentriert sich dieses Tool darauf, strukturelle Fehler zu erkennen, die nachgelagerte Tools beeinträchtigen.

Problem, das es löst

Die meisten Agentenprobleme sind keine faktischen Fehler, sondern strukturelle Probleme wie:

  • Das Modell erfindet ein Feld in einer JSON-Tool-Antwort
  • Zitieren einer Quelle, die nicht im abgerufenen Datensatz enthalten war
  • Prompt-Injection, die in abgerufenen Inhalten versteckt ist
  • Behaupten, ein Tool habe etwas zurückgegeben, was es nicht tat

Vier Unterdrücker

Das Tool enthält vier in Claude Code integrierte Unterdrücker, die als einzelner Schritt laufen, bevor die Agentenausgabe die Benutzer erreicht:

  • grounding_enforcer - prüft, ob die Modellausgabe tatsächlich durch die übergebenen Quellen unterstützt wird
  • prompt_suppressor - erkennt Injektionsversuche in abgerufenen Inhalten und Tool-Ergebnissen
  • json_suppressor - validiert strukturierte Tool-Antworten gegen erwartete Schemata
  • tool_response_suppressor - markiert, wenn die behauptete Ausgabe eines Tools nicht mit dem übereinstimmt, was es zurückgegeben hat
Ad

Verfügbarkeit

Das Tool ist in zwei Formaten verfügbar:

  • Eine REST-API
  • Ein MCP-Server (funktioniert mit Claude Desktop, Cursor, Windsurf usw.)

Der kostenlose Tarif bietet 500 Anfragen/Monat ohne Kreditkarte.

Source und Dokumentation

GitHub-Repository: https://github.com/steveswain14/mcp-hallucination-suite

API und Dokumentation: https://certifai.dev

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Werld: Offene künstliche Lebenssimulation mit sich entwickelnden neuronalen Netzen
Werkzeuge

Werld: Offene künstliche Lebenssimulation mit sich entwickelnden neuronalen Netzen

Werld ist eine Echtzeit-Simulation künstlichen Lebens, bei der Agenten mit NEAT-Neuronalen Netzen ihre eigene neuronale Architektur, sensorische Verarbeitung und Verhaltensweisen entwickeln, ohne fest kodierte Regeln oder Belohnungsfunktionen. Die Simulation beginnt mit 30 Agenten auf einem Watts-Strogatz-Kleinstwelt-Graphen mit 64 sensorischen Kanälen, 7 kontinuierlichen Motorfunktionen und 29 vererbbaren Genommerkmalen.

OpenClawRadar
MetaBot: Open-Source-Brücke verbindet Claude-Code mit Telegram, Feishu und WeChat
Werkzeuge

MetaBot: Open-Source-Brücke verbindet Claude-Code mit Telegram, Feishu und WeChat

MetaBot ist eine Open-Source-TypeScript-Brücke, die das Claude Code Agent SDK mit Messaging-Plattformen wie Telegram, Feishu und WeChat verbindet. Es bietet persistenten Speicher, geplante Aufgaben, Multi-Agenten-Kollaboration und Echtzeit-Streaming von Tool-Aufrufen.

OpenClawRadar
Skill Studio: Open-Source Desktop-App zur Verwaltung von Claude AI Agent Skills
Werkzeuge

Skill Studio: Open-Source Desktop-App zur Verwaltung von Claude AI Agent Skills

Skill Studio ist eine kostenlose, quelloffene macOS-Desktop-App, die Entwicklern ermöglicht, Community-Skill-Repositories zu durchsuchen, Dokumentation mit Markdown-Rendering in der Vorschau anzuzeigen und Skills mit einem Klick über Befehle wie npx skills add zu installieren.

OpenClawRadar
Mymir: Ein Open-Source-Projektgraph für Codierungsagenten via MCP
Werkzeuge

Mymir: Ein Open-Source-Projektgraph für Codierungsagenten via MCP

Mymir gibt Agenten eine graphbasierte Projektlandkarte mit Abhängigkeiten, Entscheidungen, Akzeptanzkriterien und früheren Ausführungsnotizen, die über MCP bereitgestellt werden, um das wiederholte Erklären des Zustands zwischen Sitzungen zu vermeiden.

OpenClawRadar