13 Wörter auf Reddit können KI-Suche manipulieren: Cornell-Forschung

✍️ OpenClawRadar📅 Veröffentlicht: 28. Juni 2026🔗 Source
13 Wörter auf Reddit können KI-Suche manipulieren: Cornell-Forschung
Ad

Neue Forschungsergebnisse der Cornell University zeigen, dass ein einzelner 13-Wörter-Schnipsel auf benutzergenerierten Inhaltsseiten (UGC) wie Reddit, Wikipedia oder Quora zuverlässig die Ausgabe von KI-Suchagenten – einschließlich ChatGPT und Google AI-Übersichten – manipulieren kann. Das Paper „Deep-research agents can be poisoned via user-generated content“ von Hal Triedman, Tingwei Zhang und Vitaly Shmatikov zeigt, wie einfach es für Marken ist, Werbeinhalte in KI-Ergebnisse einzuschleusen.

Die Forscher fanden heraus, dass Deep-Research-Agenten bei etwa der Hälfte aller Anfragen auf UGC verweisen und fast 25% aller Zitate von UGC-Websites stammen. Ein einziger vergifteter Reddit-Kommentar kann die Ausgaben für eine ganze Gruppe verwandter KI-Anfragen beeinflussen. Triedman erklärte: „Wir zeigen, dass ein winziger Schnipsel – nur 13 Wörter – von abgerufenem Text auf einer UGC-Website wie Reddit, Wikipedia, Quora, Facebook usw. KI-Agenten dazu bringen kann, konsistent Spam-/Scam-Inhalte auszugeben.“

Der Angriff nutzt aus, wie LLMs lexikalische Ähnlichkeit verwenden: Sie neigen dazu, Text zurückzugeben, der der Anfrage des Benutzers ähnlich liest. Durch das Studium beliebter KI-Anfragen können Marken Inhalte erstellen, die genau diese Anfragen widerspiegeln, und so die Ergebnisse vergiften. „Eines der entscheidenden Dinge ist, dass ein 11- bis 15-Wörter-Schnipsel, der der Anfrage sehr ähnlich ist, für ein LLM besonders überzeugend sein kann“, sagte Triedman.

Ad

Dies bestätigt, was 404 Media als boomende Branche gemeldet hat: KI-Engine-Optimierung (AEO), bei der Marken UGC-Seiten mit Werbeinhalten füllen, um die KI-Suche zu manipulieren. Beispiele sind das r/biohackers-Subreddit, das Peptid-Diskussionen aufgrund überwältigenden Astroturfings verboten hat, und Unternehmen wie RedRover, die Markenplatzierungen anbieten, um explizit KI-Suchergebnisse zu beeinflussen.

Die Forschung wirft Fragen auf, ob ehrenamtliche Moderatoren auf Reddit und Wikipedia diese Manipulation nachhaltig abwehren können, insbesondere nachdem ein deutsches Gericht entschieden hat, dass Google für KI-Übersichtsinhalte haftbar gemacht werden kann.

Für Entwickler, die KI-Agenten bauen: Das bedeutet, dass jedes Tool, das UGC-Seiten für Kontext scraped, anfällig für triviales Vergiften ist. Sich allein auf lexikalische Ähnlichkeit als Signal für Genauigkeit zu verlassen, ist nun bekanntermaßen in großem Maßstab ausbeutbar.

📖 Lesen Sie die vollständige Quelle: HN AI Agents

Ad

👀 Siehe auch

CodeWall KI-Agent entdeckt kritische Schwachstellen in McKinseys Lilli-Plattform
Sicherheit

CodeWall KI-Agent entdeckt kritische Schwachstellen in McKinseys Lilli-Plattform

CodeWalls autonomer offensiver KI-Agent erhielt innerhalb von 2 Stunden vollständigen Lese-/Schreibzugriff auf McKinseys interne Lilli-KI-Plattform-Datenbank und legte 46,5 Millionen Chat-Nachrichten, 728.000 Dateien und sensible Systemkonfigurationen durch SQL-Injection- und IDOR-Schwachstellen offen.

OpenClawRadar
OneCLI: Open-Source Credential Vault für KI-Agenten
Sicherheit

OneCLI: Open-Source Credential Vault für KI-Agenten

OneCLI ist ein in Rust geschriebenes Open-Source-Gateway, das zwischen KI-Agenten und externen Diensten sitzt und echte Zugangsdaten zur Laufzeit einfügt, während Agenten nur Platzhalter-Schlüssel sehen. Es bietet AES-256-GCM-verschlüsselte Speicherung, läuft in einem einzelnen Docker-Container mit eingebettetem PGlite und funktioniert mit jedem Agenten-Framework, das einen HTTPS_PROXY setzen kann.

OpenClawRadar
Microsofts Open-Source-Tools gehackt: Passwort-stehlende Malware trifft KI-Entwickler-Repos
Sicherheit

Microsofts Open-Source-Tools gehackt: Passwort-stehlende Malware trifft KI-Entwickler-Repos

Hacker haben mindestens 70 Microsoft GitHub-Repos mit Passwort-stehlender Malware infiltriert, die KI-Entwickler anvisiert, die Claude Code, Gemini CLI und VS Code nutzen. Es handelt sich um eine erneute Kompromittierung des Durable Task-Projekts.

OpenClawRadar
Clawvisor: Zweckbasierte Autorisierungsschicht für OpenClaw-Agenten
Sicherheit

Clawvisor: Zweckbasierte Autorisierungsschicht für OpenClaw-Agenten

Clawvisor ist eine Autorisierungsschicht, die zwischen KI-Agenten und APIs sitzt und zweckbasierte Autorisierung durchsetzt, bei der Agenten Absichten deklarieren, Benutzer bestimmte Zwecke genehmigen und ein KI-Gatekeeper jede Anfrage gegen diesen Zweck überprüft. Anmeldedaten verlassen Clawvisor nie und Agenten sehen sie nie.

OpenClawRadar