FORGE: Фреймворк с открытым исходным кодом для тестирования безопасности ИИ-систем на основе LLM

FORGE (Framework for Orchestrated Reasoning & Generation of Engines) — это фреймворк с открытым исходным кодом для автономного тестирования безопасности систем LLM, который работает круглосуточно и охватывает уязвимости из OWASP LLM Top 10.
Ключевые возможности
- Создаёт собственные инструменты в процессе работы — генерирует пользовательские модули Python на лету при обнаружении неизвестных уязвимостей
- Самовоспроизводится в рой — создаёт копии в подпроцессах, которые разделяют коллективный разум в реальном времени
- Учится на каждой сессии — использует SQLite для хранения шаблонов, ИИ оценивает находки, а генетические алгоритмы развивают его собственные промпты
- ИИ-пентестинг ИИ — 7 модулей, охватывающих уязвимости из OWASP LLM Top 10
- Ловушка — поддельная уязвимая конечная точка ИИ, которая перехватывает атакующих и определяет, являются ли они человеком или агентом ИИ
- Круглосуточный мониторинг — отслеживает ИИ в продакшене, оповещает о скачках задержки, всплесках атак и попытках инъекций через вебхук Slack/Discord
- Стресс-тестер — тестирование устойчивости к OWASP LLM04 DoS с живой панелью TPS и оценкой от A до F
- Работает с любой моделью — Claude, Llama, Mistral, DeepSeek, GPT-4, Groq, любая — одна переменная окружения для переключения
Покрытие OWASP LLM Top 10
- LLM01 Инъекция промптов → prompt_injector + jailbreak_fuzzer (125 полезных нагрузок)
- LLM02 Небезопасный вывод → rag_leaker
- LLM04 DoS модели → overloader (8 режимов стресса)
- LLM06 Раскрытие конфиденциальной информации → system_prompt_probe + rag_leaker
- LLM07 Небезопасный плагин → agent_hijacker
- LLM08 Чрезмерные полномочия → agent_hijacker
- LLM10 Кража модели → model_fingerprinter
Установка и использование
Команды установки:
git clone https://github.com/umangkartikey/forge
cd forge
pip install anthropic rich
export ANTHROPIC_API_KEY=your_keyЗапуск с локальным Ollama бесплатно:
FORGE_BACKEND=ollama FORGE_MODEL=llama3.1 python forge.pyИнструмент решает распространённые проблемы безопасности LLM: большинство ИИ-приложений, развёрнутых сегодня, никогда не проходили редкостинг, системные промпты полностью извлекаемы, джейлбрейки работают, RAG-конвейеры протекают, а косвенная инъекция промптов через вывод инструментов почти повсеместно незащищена. FORGE автоматизирует поиск этих уязвимостей так же, как это сделал бы человек-редтимер, но быстрее и работает круглосуточно.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Новый скилл автоматизирует защиту OpenClaw на удалённых серверах
Разработчик из сообщества выпустил скилл, который помогает ИИ-ассистентам автоматически защищать установки OpenClaw на удалённых серверах.

FastCGI: 30 лет, и всё ещё лучший протокол для обратных прокси
FastCGI избегает HTTP-десинхронизации и проблем с ненадежными заголовками, используя явную фреймовую структуру сообщений и отдельные каналы параметров, что делает его более безопасным выбором для взаимодействия между прокси и бэкендом.

Данные об угрозах из 91 тыс. взаимодействий с ИИ-агентами: злоупотребление инструментами выросло на 6,4%, появились новые мультимодальные атаки.
Анализ 91 284 взаимодействий ИИ-агентов за февраль 2026 года показывает, что злоупотребление инструментами/командами увеличилось на 6,4% до 14,5%, причём эскалация цепочки инструментов является доминирующим паттерном. Отравление RAG сместилось в сторону атак на метаданные (12,0%), а мультимодальная инъекция через изображения/PDF-файлы появилась на уровне 2,3%.

Критические уязвимости безопасности OpenClaw устранены в версии 2026.3.28.
Версия OpenClaw 2026.3.28 исправляет 8 критических уязвимостей в системе безопасности, обнаруженных Ant AI Security Lab, включая обход песочницы, повышение привилегий и риски SSRF. Пользователям версий ≤2026.3.24 следует немедленно обновиться.