Frontier AI сломал соревнования CTF — GPT-5.5 решает безумные задачи Pwn с первой попытки

Соревнования Capture The Flag (CTF) исторически были полигоном для талантов в области безопасности, но, по словам бывшего топ-игрока kabir.au, открытый формат CTF теперь фактически мёртв. Причина: передовые модели ИИ, которые решают задачи быстрее людей с минимальным участием человека.
Что изменилось: от помощи к автоматизации
Когда GPT-4 только запустили, он мог с одного раза решать CTF-задачи средней сложности — криптографическую задачу можно было вставить в ChatGPT и получить флаг через 10 минут. Влияние было ограниченным, так как сложные задачи оставались нетронутыми. Claude Opus 4.5 изменил баланс: «Почти каждая задача средней сложности и некоторые сложные задачи стали решаемыми с помощью агента». С Claude Code, упаковавшим модель в CLI, стало тривиально создать оркестратор, который использует API CTFd для запуска экземпляра Claude на каждую задачу и оставляет его работать без присмотра в первый час.
GPT-5.5 закрепляет результат
Автор, много работавший с GPT-5.5 и GPT-5.5 Pro, сообщает: «Эти модели могут с одного раза решать задачи Insane сложности по эксплуатации куч на HackTheBox». Pro «вероятно, превосходит» Claude Mythos по возможностям. Следствие: за 48-часовой CTF оркестрированный агент Pro может решить большинство задач от небольших организаторов, превращая открытые CTF в pay-to-win — чем больше токенов вы можете позволить, тем быстрее вы разбираете доску.
Таблицы результатов больше не измеряют навыки
Рейтинг CTFTime теперь отражает способности к оркестрации и бюджет, а не экспертизу в безопасности. Легендарные команды появляются реже; разработчики задач теряют мотивацию. Автор утверждает, что даже аргумент «новички всё ещё могут учиться» упускает суть: видимая таблица результатов доминируется командами, использующими ИИ, что заставляет новичков полагаться на ИИ до того, как сформируются базовые инстинкты, — антипаттерн, препятствующий активному обучению.
Последствия для найма
Наём на основе результатов CTF становится менее значимым. Оркестрация ИИ для CTF уже открыта или «vibe codeable», поэтому соотношение сигнал/шум резко падает. Автор, бывший участник топ-команды TheHackersCrew, заключает, что соревнование теперь — это лёгкая для взлома каша: «Ваша производительность в CTF больше не определяет ваш навык так, как раньше».
📖 Read the full source: HN AI Agents
👀 Смотрите также

Google сообщает, что хакерские атаки с использованием ИИ достигли промышленных масштабов за 3 месяца
Группа разведки угроз Google обнаружила, что преступные и государственные группы используют коммерческие модели ИИ (Gemini, Claude, OpenAI) для доработки и масштабирования атак. Одна группа едва не использовала уязвимость нулевого дня для массовой эксплуатации, а другие экспериментируют с незащищенным агентом OpenClaw.

OpenClaw Security: 13 практических шагов для защиты вашего ИИ-агента
В посте на Reddit изложены 13 мер безопасности для установок OpenClaw, включая запуск на отдельной машине, использование Tailscale для изоляции сети, изоляцию под-агентов в Docker и настройку белых списков для доступа пользователей.

ClawGuard: Открытый шлюз безопасности для защиты учетных данных API OpenClaw
ClawGuard — это шлюз безопасности, который располагается между AI-агентами и внешними API, используя фиктивные учетные данные на машине агента, в то время как реальные токены хранятся отдельно. Он обеспечивает подтверждение через Telegram для чувствительных вызовов и ведет журнал аудита запросов.

llm-hasher: Локальное обнаружение PII и токенизация для гибридных LLM-процессов
llm-hasher — это инструмент, который обнаруживает личную идентифицируемую информацию локально с помощью Ollama до того, как данные попадут к внешним LLM, таким как OpenAI или Claude, токенизирует PII и восстанавливает исходные значения после обработки. Он использует регулярные выражения для структурированных типов данных и локальную LLM для контекстного обнаружения, с зашифрованным хранилищем для сопоставлений.