Claude Code Encuentra una Vulnerabilidad de 23 Años en el Kernel de Linux

Nicholas Carlini, un científico investigador de Anthropic, informó en la conferencia de seguridad de IA [un]prompted que utilizó Claude Code para encontrar múltiples vulnerabilidades de seguridad explotables de forma remota en el kernel de Linux, incluida una que permaneció sin descubrir durante 23 años.
Cómo Claude Code Encontró el Error
Carlini se sorprendió por la poca supervisión que necesitaba Claude Code. Básicamente, apuntó Claude Code al código fuente del kernel de Linux y preguntó: "¿Dónde están las vulnerabilidades de seguridad?" usando un script simple que iteraba sobre todos los archivos en el árbol de código fuente.
# Iterar sobre todos los archivos en el árbol de código fuente.
find . -type f -print0 | while IFS = read -r -d '' file; do
# Decirle a Claude Code que busque vulnerabilidades en cada archivo.
claude \
--verbose \
--dangerously-skip-permissions \
--print "Estás participando en un CTF. \
Encuentra una vulnerabilidad. \
pista: mira $file \
Escribe la más grave \
en /out/report.txt."
done
El script le dice a Claude Code que el usuario está participando en una competencia de ciberseguridad de captura la bandera. Para evitar encontrar la misma vulnerabilidad repetidamente, el script recorre cada archivo fuente en el kernel de Linux, diciéndole a Claude que el error probablemente esté en cada archivo secuencialmente.
La Vulnerabilidad de NFS
Carlini se centró en un error que Claude encontró en el controlador de sistema de archivos de red (NFS) de Linux que permite a un atacante leer memoria sensible del kernel a través de la red. Este error requería que el modelo de IA entendiera detalles intrincados de cómo funciona el protocolo NFS.
El ataque requiere dos clientes NFS que cooperen para atacar un servidor NFS de Linux:
- El Cliente A adquiere un bloqueo con un ID de propietario de 1024 bytes (inusualmente largo pero legal)
- El Cliente B intenta adquirir el mismo bloqueo y es denegado
- Al generar la respuesta de denegación, el servidor NFS usa un búfer de 112 bytes pero necesita escribir 1056 bytes (incluido el ID de propietario de 1024 bytes)
- Esto causa un desbordamiento de búfer de montón donde el atacante puede sobrescribir la memoria del kernel con bytes que controla
Dato curioso: Claude Code creó los diagramas de protocolo ASCII que muestran la secuencia del ataque como parte de su informe inicial del error.
Contexto Histórico
Este error se introdujo en el kernel de Linux en marzo de 2003 ([email protected], 2003-09-22 19:22:37-07:00) y permaneció sin descubrir durante 23 años hasta que Claude Code lo encontró.
Carlini señaló: "Ahora tenemos varios desbordamientos de búfer de montón explotables de forma remota en el kernel de Linux. Nunca había encontrado uno de estos en mi vida antes. Esto es muy, muy, muy difícil de hacer. Con estos modelos de lenguaje, tengo varios."
📖 Read the full source: HN AI Agents
👀 Ver también

Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA
Sieve escanea los historiales de chat de Cursor, Claude Code, Copilot y otros asistentes de codificación con IA en busca de claves API y tokens filtrados. Todo el escaneo es local, con redacción y bóveda de llavero de macOS.

Integración del Agente SOC OpenClaw para la Caza de Amenazas en el Laboratorio Casero SIEM
Un usuario de Reddit comparte su configuración de SIEM de código abierto llamada Red Threat Redemption en Debian 13, integrando Elasticsearch, Kibana, Wazuh, Zeek y pfSense con Suricata, luego añade un agente de IA para correlación automatizada de amenazas, búsqueda de amenazas y clasificación de alertas.

Aloja OpenClaw de forma segura en un VPS con Tailscale y más.
Configura OpenClaw de manera segura en un VPS utilizando Tailscale, fail2ban, UFW y más, evitando la exposición pública y fortaleciendo la defensa.

El SDK de Acceso del Agente de Bitwarden se integra con OneCLI para la inyección segura de credenciales.
El nuevo SDK de Acceso de Agentes de Bitwarden permite que los agentes de IA accedan a credenciales desde la bóveda de Bitwarden con aprobación humana, mientras que OneCLI actúa como una puerta de enlace que inyecta credenciales en la capa de red sin exponer los valores originales a los agentes.