ИИ-агент с книгами находит 8 критических багов в Next.js

Пользователь Reddit провёл эксперимент, сравнивая подходы к аудиту безопасности с помощью ИИ на одном кодовом проекте, чтобы проверить, как доступ к знаниям влияет на результаты. В качестве тестового объекта использовался открытый стартовый набор SaaS на Next.js от BoxyHQ.

Три метода аудита в сравнении

Разработчик провёл три независимых аудита безопасности:

Встроенная проверка безопасности Claude Code: Обнаружила 1 критическую, 6 высоких и 13 проблем средней степени серьёзности
ИИ-агент без дополнительного контекста: Обнаружил 1 критическую, 5 высоких и 14 проблем средней степени серьёзности
ИИ-агент с доступом к 10 профессиональным книгам по безопасности: Обнаружил 8 критических, 9 высоких и 10 проблем средней степени серьёзности

Ключевые выводы

Агент с доступом к книгам выявил уязвимости, которые другие методы полностью пропустили, включая:

Токены сброса пароля, хранящиеся в открытом виде
Состояние гонки TOCTOU (Time-of-Check to Time-of-Use) при проверке токенов
Флаг функции, который вызывает res.status(404), но не завершает выполнение, позволяя коду продолжать работу

Разработчик отметил, что это не какие-то редкие случаи, а именно те проблемы, которые встречаются в реальных нарушениях безопасности. Эксперимент использовал один и тот же кодовый проект и одну и ту же модель ИИ во всех трёх тестах, единственной переменной был доступный агенту объём знаний.

Последствия для разработки с помощью ИИ

Эксперимент показывает, что ИИ-агенты ограничены не интеллектом, а тем, какие знания они могут получить в нужный момент. Разработчик сделал вывод, что знания о безопасности «находятся над кодом», а не в нём, подчёркивая важность предоставления ИИ-инструментам предметных справочных материалов вместо того, чтобы полагаться только на их базовое обучение.

Такой подход к расширению возможностей ИИ-агентов специализированными источниками знаний может быть особенно актуален для разработчиков, использующих ИИ-помощников для проверки безопасности, где доступ к актуальным справочникам и лучшим практикам значительно влияет на качество обнаруженных проблем.

📖 Read the full source: r/ClaudeAI

Эксперимент по проверке безопасности показывает, что производительность ИИ-агента зависит от доступа к знаниям.

Три метода аудита в сравнении

Ключевые выводы

Последствия для разработки с помощью ИИ

👀 Смотрите также

Clawvisor: Уровень авторизации на основе целей для агентов OpenClaw

Аудит безопасности выявил уязвимости в эталонных серверах MCP компании Anthropic, которые создают риски, связанные с генерацией ложных данных.

От фермы до кода: Как фермер создал защиту в реальном времени с открытым исходным кодом для OpenClaw

Практические меры безопасности для агентов OpenClaw