FORGE: Marco de Pruebas de Seguridad de IA de Código Abierto para Sistemas LLM

✍️ OpenClawRadar📅 Publicado: 7 de marzo de 2026🔗 Source
FORGE: Marco de Pruebas de Seguridad de IA de Código Abierto para Sistemas LLM
Ad

FORGE (Framework for Orchestrated Reasoning & Generation of Engines) es un marco de pruebas de seguridad de IA autónomo de código abierto para sistemas LLM que funciona 24/7 y cubre las 10 principales vulnerabilidades OWASP LLM.

Características Clave

  • Construye sus propias herramientas durante la ejecución — genera módulos Python personalizados al instante cuando encuentra vulnerabilidades desconocidas
  • Se autoreplica en un enjambre — crea copias en subprocesos que comparten una mente colmena en vivo
  • Aprende de cada sesión — usa SQLite para almacenar patrones, la IA puntúa hallazgos y algoritmos genéticos evolucionan sus propios prompts
  • Pentesting de IA por IA — 7 módulos que cubren las 10 principales vulnerabilidades OWASP LLM
  • Honeypot — endpoint de IA vulnerable falso que atrapa atacantes y clasifica si son humanos o agentes de IA
  • Monitor 24/7 — vigila la IA en producción, alerta sobre picos de latencia, ráfagas de ataques e intentos de inyección mediante webhook de Slack/Discord
  • Probador de estrés — pruebas de resiliencia OWASP LLM04 DoS con panel de TPS en vivo y calificación A-F
  • Funciona con cualquier modelo — Claude, Llama, Mistral, DeepSeek, GPT-4, Groq, cualquiera — una variable de entorno para cambiar
Ad

Cobertura de las 10 Principales Vulnerabilidades OWASP LLM

  • LLM01 Inyección de Prompt → prompt_injector + jailbreak_fuzzer (125 payloads)
  • LLM02 Salida Insegura → rag_leaker
  • LLM04 DoS del Modelo → overloader (8 modos de estrés)
  • LLM06 Divulgación de Información Sensible → system_prompt_probe + rag_leaker
  • LLM07 Plugin Inseguro → agent_hijacker
  • LLM08 Agencia Excesiva → agent_hijacker
  • LLM10 Robo de Modelo → model_fingerprinter

Configuración y Uso

Comandos de instalación:

git clone https://github.com/umangkartikey/forge
cd forge
pip install anthropic rich
export ANTHROPIC_API_KEY=your_key

Ejecutar con Ollama local de forma gratuita:

FORGE_BACKEND=ollama FORGE_MODEL=llama3.1 python forge.py

La herramienta aborda las brechas de seguridad comunes de LLM: la mayoría de las aplicaciones de IA implementadas hoy nunca han sido sometidas a pruebas de red teaming, los prompts del sistema son completamente extraíbles, los jailbreaks funcionan, las canalizaciones RAG tienen fugas y la inyección indirecta de prompts a través de salidas de herramientas está casi universalmente desprotegida. FORGE automatiza la búsqueda de estas vulnerabilidades de la misma manera que lo haría un equipo rojo humano, pero más rápido y funcionando 24/7.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Google dice que hackers criminales usaron IA para encontrar vulnerabilidad de día cero
Seguridad

Google dice que hackers criminales usaron IA para encontrar vulnerabilidad de día cero

Google reveló que atacantes utilizaron un agente de IA para descubrir y explotar una vulnerabilidad de software previamente desconocida, marcando el primer caso confirmado de descubrimiento de día cero impulsado por IA en el entorno real.

OpenClawRadar
Analizador de Habilidades Ahora Disponible en ClawHub con Instalación de un Solo Comando
Seguridad

Analizador de Habilidades Ahora Disponible en ClawHub con Instalación de un Solo Comando

El analizador de seguridad OpenClaw Skill Analyzer ya está disponible en ClawHub con una instalación de un solo comando. La herramienta escanea carpetas de habilidades en busca de patrones maliciosos como inyección de comandos y robo de credenciales, e incluye soporte de entorno aislado Docker para una ejecución segura.

OpenClawRadar
Traducción al español:

**La aplicación de escritorio Claude de Anthropic instala un puente de mensajería nativa no revelado**
Seguridad

Traducción al español: **La aplicación de escritorio Claude de Anthropic instala un puente de mensajería nativa no revelado**

Claude Desktop instala silenciosamente una extensión de navegador preautorizada que permite la mensajería nativa, generando preocupaciones de seguridad.

OpenClawRadar
Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA
Seguridad

Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA

Sieve escanea los historiales de chat de Cursor, Claude Code, Copilot y otros asistentes de codificación con IA en busca de claves API y tokens filtrados. Todo el escaneo es local, con redacción y bóveda de llavero de macOS.

OpenClawRadar