FORGE: Marco de pruebas de seguridad IA para LLM

FORGE (Framework for Orchestrated Reasoning & Generation of Engines) es un marco de pruebas de seguridad de IA autónomo de código abierto para sistemas LLM que funciona 24/7 y cubre las 10 principales vulnerabilidades OWASP LLM.

Características Clave

Construye sus propias herramientas durante la ejecución — genera módulos Python personalizados al instante cuando encuentra vulnerabilidades desconocidas
Se autoreplica en un enjambre — crea copias en subprocesos que comparten una mente colmena en vivo
Aprende de cada sesión — usa SQLite para almacenar patrones, la IA puntúa hallazgos y algoritmos genéticos evolucionan sus propios prompts
Pentesting de IA por IA — 7 módulos que cubren las 10 principales vulnerabilidades OWASP LLM
Honeypot — endpoint de IA vulnerable falso que atrapa atacantes y clasifica si son humanos o agentes de IA
Monitor 24/7 — vigila la IA en producción, alerta sobre picos de latencia, ráfagas de ataques e intentos de inyección mediante webhook de Slack/Discord
Probador de estrés — pruebas de resiliencia OWASP LLM04 DoS con panel de TPS en vivo y calificación A-F
Funciona con cualquier modelo — Claude, Llama, Mistral, DeepSeek, GPT-4, Groq, cualquiera — una variable de entorno para cambiar

Cobertura de las 10 Principales Vulnerabilidades OWASP LLM

LLM01 Inyección de Prompt → prompt_injector + jailbreak_fuzzer (125 payloads)
LLM02 Salida Insegura → rag_leaker
LLM04 DoS del Modelo → overloader (8 modos de estrés)
LLM06 Divulgación de Información Sensible → system_prompt_probe + rag_leaker
LLM07 Plugin Inseguro → agent_hijacker
LLM08 Agencia Excesiva → agent_hijacker
LLM10 Robo de Modelo → model_fingerprinter

Configuración y Uso

Comandos de instalación:

git clone https://github.com/umangkartikey/forge
cd forge
pip install anthropic rich
export ANTHROPIC_API_KEY=your_key

Ejecutar con Ollama local de forma gratuita:

FORGE_BACKEND=ollama FORGE_MODEL=llama3.1 python forge.py

La herramienta aborda las brechas de seguridad comunes de LLM: la mayoría de las aplicaciones de IA implementadas hoy nunca han sido sometidas a pruebas de red teaming, los prompts del sistema son completamente extraíbles, los jailbreaks funcionan, las canalizaciones RAG tienen fugas y la inyección indirecta de prompts a través de salidas de herramientas está casi universalmente desprotegida. FORGE automatiza la búsqueda de estas vulnerabilidades de la misma manera que lo haría un equipo rojo humano, pero más rápido y funcionando 24/7.

📖 Leer la fuente completa: r/LocalLLaMA

FORGE: Marco de Pruebas de Seguridad de IA de Código Abierto para Sistemas LLM

Características Clave

Cobertura de las 10 Principales Vulnerabilidades OWASP LLM

Configuración y Uso

👀 Ver también

Claude Code --vulnerabilidad de omisión peligrosa de permisos y herramienta de defensa de código abierto

Aislamiento de Agentes de IA con WebAssembly: Autoridad Cero por Defecto

Nueva skill automatiza el refuerzo de seguridad de OpenClaw en servidores remotos

Exploit asistido por LLM: la vista previa de Mythos de Anthropic ayudó a construir el primer exploit público del kernel de macOS en Apple M5 en cinco días