Frontier-KI hat CTF-Wettbewerbe gesprengt — GPT-5.5 meistert verrückte Pwn-Herausforderungen auf Anhieb

Capture The Flag (CTF)-Wettbewerbe waren historisch gesehen ein Prüfstein für Sicherheitstalente, aber laut dem ehemaligen Top-Spieler kabir.au ist das offene CTF-Format nun effektiv tot. Der Grund: Spitzen-KI-Modelle, die Herausforderungen schneller als Menschen lösen können, mit minimaler menschlicher Beteiligung.
Was sich geändert hat: Von Unterstützung zu Automatisierung
Als GPT-4 erstmals veröffentlicht wurde, konnte es mittelschwere CTF-Herausforderungen mit einem einzigen Durchlauf lösen – eine Kryptographie-Herausforderung konnte in ChatGPT eingefügt werden und innerhalb von 10 Minuten eine Flagge liefern. Die Auswirkung war begrenzt, da schwere Herausforderungen unberührt blieben. Claude Opus 4.5 verschob das Gleichgewicht: „Nahezu jede mittelschwere Herausforderung und einige schwere Herausforderungen wurden durch Agenten lösbar.“ Mit Claude Code, das das Modell in ein CLI verpackt, wurde es trivial, einen Orchestrator zu bauen, der die CTFd-API nutzt, um eine Claude-Instanz pro Herausforderung zu starten und sie in der ersten Stunde unbeaufsichtigt laufen zu lassen.
GPT-5.5 besiegelt die Sache
Der Autor, der umfangreich mit GPT-5.5 und GPT-5.5 Pro gearbeitet hat, berichtet: „Diese Modelle können mit einem einzigen Durchlauf Insane-schwere aktive leakless Heap-Pwn-Herausforderungen auf HackTheBox lösen.“ Pro „übertrifft wahrscheinlich“ Claude Mythos an Fähigkeiten. Die Implikation: In einem 48-Stunden-CTF kann ein orchestrierter Pro-Agent die Mehrheit der Herausforderungen kleinerer Organisatoren lösen, wodurch offene CTFs zu Pay-to-Win werden – je mehr Tokens man sich leisten kann, desto schneller räumt man das Board ab.
Bestenlisten messen nicht mehr die Fähigkeiten
Die CTFTime-Bestenliste spiegelt nun Orchestrierungsfähigkeit und Budget wider, nicht Sicherheitsexpertise. Legendäre Teams treten seltener auf; Herausforderungsentwickler verlieren die Motivation. Der Autor argumentiert, dass selbst das Argument „Anfänger können immer noch lernen“ am Punkt vorbeigeht: Die sichtbare Bestenliste wird von KI-nutzenden Teams dominiert, was Anfänger unter Druck setzt, sich auf KI zu verlassen, bevor sie grundlegende Instinkte aufbauen – ein Anti-Pattern, das aktives Lernen verhindert.
Auswirkungen auf die Rekrutierung
Die Rekrutierung über CTF-Leistungen wird zunehmend bedeutungslos. KI-Orchestrierung für CTFs ist bereits Open Source oder „vibe codeable“, sodass das Signal-Rausch-Verhältnis zusammenbricht. Der Autor, ein ehemaliges Mitglied des Top-Teams TheHackersCrew, schließt daraus, dass der Wettbewerb nun ein ausnutzbares Chaos ist: „Deine Leistung in einem CTF definiert nicht mehr deine Fähigkeiten, wie es früher der Fall war.“
📖 Den vollständigen Quelltext lesen: HN AI Agents
👀 Siehe auch

OpenClaw 2026.3.28 behebt 8 Sicherheitslücken, darunter kritische Rechteausweitung
OpenClaw 2026.3.28 behebt 8 Sicherheitslücken, die vom Ant AI Security Lab entdeckt wurden, darunter eine kritische Rechteausweitung über /pair approve und eine hochgradige Sandbox-Umgehung im Nachrichten-Tool.

KI-Chatbots geben echte Telefonnummern preis: Das Problem der Offenlegung personenbezogener Daten
Chatbots wie Gemini, ChatGPT und Claude geben aufgrund von personenbezogenen Daten in Trainingsdaten echte private Telefonnummern preis. DeleteMe meldet einen Anstieg von KI-bezogenen Datenschutzanfragen um 400% in sieben Monaten.

KI-Chatbots können Werbung in ihre Antworten einfügen, ohne dass die Nutzer es bemerken.
Forschung zeigt, dass KI-Chatbots heimlich Produktwerbung in Antworten einbetten können, was die Wahl der Nutzer beeinflusst, während die meisten Teilnehmer die Manipulation nicht bemerkten. Die Studie verwendete einen maßgeschneiderten Chatbot, um den Effekt zu demonstrieren.

Roblox-Betrug und KI-Tool verursachten Ausfall der Vercel-Plattform
Ein Roblox-Cheat in Kombination mit einem KI-Tool hat Berichten zufolge einen kompletten Plattformausfall bei Vercel verursacht und auf Hacker News mit 66 Punkten und 24 Kommentaren für erhebliche Diskussionen gesorgt.