Zwei südafrikanische Innenministeriumsbeamte wegen KI-Halluzinationen in Politikpapier suspendiert

Das südafrikanische Innenministerium (DHA) suspendierte zwei Beamte, nachdem in der Referenzliste eines überarbeiteten Weißbuchs zu Staatsbürgerschaft, Einwanderung und Flüchtlingsschutz KI-generierte Halluzinationen entdeckt wurden. Die Suspendierung betrifft den Hauptdirektor der Abteilung für Staatsbürgerschaft und Einwanderung sowie den für die Ausarbeitung des Dokuments zuständigen Direktor.
Was geschah
Die Unstimmigkeiten wurden in der dem Weißbuch beigefügten Referenzliste gefunden. Die Referenzen erwiesen sich als Halluzinationen – fehlerhafte oder fiktive Ausgaben großer Sprachmodelle (LLMs). Laut der DHA-Erklärung scheinen die Referenzen nachträglich generiert und angehängt worden zu sein, da sie im Textkörper nicht zitiert werden.
Reaktion und neue Verfahren
Das DHA räumte die Peinlichkeit ein und erklärte, dass der Vorfall genutzt werde, um Prozesse zu modernisieren. Künftig werden sie KI-Prüfungen und -Erklärungen als Teil interner Genehmigungsverfahren entwickeln und implementieren. Zwei unabhängige Anwaltskanzleien wurden beauftragt, das Disziplinarverfahren zu leiten und alle politischen Dokumente zu überprüfen, die seit dem 30. November 2022 – dem Datum der öffentlichen Veröffentlichung von ChatGPT – erstellt wurden.
Das DHA betont, dass die überarbeitete Politik die Position der Regierung korrekt widerspiegelt und hinter ihrem Inhalt steht; die Halluzinationen seien auf die eigenständige Referenzliste beschränkt gewesen.
Breiterer Kontext
Dieser Vorfall folgt auf einen ähnlichen eine Woche zuvor, als das Ministerium für Kommunikation und Digitaltechnologien (DCDT) seinen Entwurf der Nationalen KI-Politik zurückzog, nachdem fiktive Quellen gefunden wurden. Minister Solly Malatsi bemerkte: „Die plausibelste Erklärung ist, dass KI-generierte Zitate ohne ordnungsgemäße Überprüfung aufgenommen wurden.“
Das DHA akzeptierte die zunehmende Nutzung von KI und sagte, dass Institutionen sich anpassen müssten: „Es ist eine transformative, aber disruptive Technologie, die die Arbeitsweise von Organisationen im privaten und öffentlichen Sektor verändert. Wir müssen uns jetzt anpassen, um Schritt zu halten.“
Dieser Fall verdeutlicht eine reale Konsequenz der Verwendung von LLMs zur Dokumentenerstellung ohne strenge Überprüfung – insbesondere in der Regierung, wo Genauigkeit entscheidend ist. Für Entwickler, die mit KI-Agenten arbeiten, unterstreicht es die Notwendigkeit von Validierungsebenen, Zitierprüfungen und menschlicher Kontrolle.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Claude Code fügt geplante Aufgabenausführung für automatisierte Workflows hinzu
Anthropic hat die geplante Ausführung für Claude Code aktiviert, sodass Entwickler Aufgaben einmal einstellen und automatisch ohne manuelle Aufforderung ausführen lassen können. Die Funktion unterstützt tägliche Commit-Überprüfungen, Abhängigkeitsprüfungen, Fehlerprotokoll-Scans und PR-Überprüfungen.

TranslateGemma-12b: Menschliche Überprüfung erkennt 71% der Fehler, die automatisierte Metriken übersehen
Die menschliche MQM-Überprüfung deckte bei 71 % der Übersetzungssegmente Mängel auf, die von automatisierten Metriken als einwandfrei bewertet wurden. Sämtliche 25 Genauigkeitsfehler befanden sich im metric-blinden Quadranten.

"FastTab mit KI erstellen: Ein benutzerdefinierter Task-Switcher für X11"
FastTab behebt ein spezifisches Leistungsproblem im Plasma-Task-Switcher auf X11 mithilfe von Zig und OpenGL, unterstützt durch KI-Tools wie Claude.

Anthropics neues Claude-Abonnement-Guthaben: Agent SDK und claude -p erhalten ab 15. Juni getrennte gedeckelte Pools
Ab dem 15. Juni erhalten Claude-Abonnenten ein separates monatliches Guthaben für die Nutzung des Agent SDK und von claude -p: 200 $/Monat für Max 20x, 100 $ für Max 5x, 20 $ für Pro. Die Nutzung stoppt, wenn das Guthaben aufgebraucht ist, es sei denn, es wird eine zusätzliche Abrechnung aktiviert. Die interaktive Nutzung von Claude Code und Chat bleibt im Abonnement-Pool.