Escáner de Inyección de Solicitudes en Modelos Locales para la Seguridad de Habilidades de IA

✍️ OpenClawRadar📅 Publicado: 20 de marzo de 2026🔗 Source
Escáner de Inyección de Solicitudes en Modelos Locales para la Seguridad de Habilidades de IA
Ad

Vulnerabilidad de Seguridad en Habilidades de IA

Una discusión en X destacó una grave falla de seguridad en habilidades de IA de terceros. Claude Code admite el operador ! para ejecutar comandos bash directamente dentro de las habilidades, pero estos operadores pueden ocultarse en etiquetas HTML, lo que lleva a ejecuciones bash de las que el LLM podría no estar consciente.

Implementación del Escáner Local

Se ha construido una herramienta de prueba de concepto para escanear habilidades en busca de posibles inyecciones de malware durante la instalación. El escáner utiliza un modelo sin capacidad de llamadas a herramientas que se ejecuta localmente, específicamente mistral-small:latest en Ollama. El creador informa que "funcionó de maravilla" durante las pruebas.

El enfoque funciona de manera similar a un escáner de virus y podría integrarse en un futuro producto "instalador de habilidades". La protección contra la inyección de prompts se identifica como una aplicación prometedora para modelos locales.

Ad

Detalles Técnicos

La vulnerabilidad involucra el operador ! en Claude Code que permite la ejecución directa de comandos bash. Los atacantes pueden ocultar estos operadores dentro de etiquetas HTML, ejecutando potencialmente comandos maliciosos sin el conocimiento del LLM. El escáner aborda esto analizando las habilidades antes de la instalación para detectar tales inyecciones ocultas.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Usuario de Reddit reporta persistencia de VM OpenClaw y actividad sospechosa
Seguridad

Usuario de Reddit reporta persistencia de VM OpenClaw y actividad sospechosa

Un usuario de Reddit informa que su máquina virtual OpenClaw se reinicia automáticamente después de cerrarse y muestra un comportamiento sospechoso, incluyendo la apertura de Microsoft Store y el intento de descargar archivos cuestionables.

OpenClawRadar
La API de AviationWeather.gov Contiene un Intento de Inyección de Comando 'Stop Claude'
Seguridad

La API de AviationWeather.gov Contiene un Intento de Inyección de Comando 'Stop Claude'

Un usuario informa que la API de AviationWeather.gov del gobierno de EE. UU. devuelve el texto 'Stop Claude' en sus respuestas cuando se accede a través de Claude CoWork, lo que activa una notificación de seguridad sobre ataques de inyección de prompts.

OpenClawRadar
Vulnerabilidades de Seguridad de la Función 'Permitir Siempre' de OpenClaw y Alternativas Más Seguras
Seguridad

Vulnerabilidades de Seguridad de la Función 'Permitir Siempre' de OpenClaw y Alternativas Más Seguras

La función de aprobación 'permitir siempre' de OpenClaw ha sido objeto de dos CVEs este mes, permitiendo la ejecución de comandos no autorizados mediante la vinculación de comandos wrapper y la omisión de continuación de línea en el shell. El problema más profundo es cómo esta función entrena a los usuarios para dejar de prestar atención a las solicitudes de seguridad.

OpenClawRadar
Agente de IA Explota Inyección SQL para Comprometer el Chatbot Lilli de McKinsey
Seguridad

Agente de IA Explota Inyección SQL para Comprometer el Chatbot Lilli de McKinsey

Investigadores de seguridad de CodeWall utilizaron un agente de IA autónomo para hackear el chatbot interno Lilli de McKinsey, obteniendo acceso completo de lectura y escritura a su base de datos de producción en dos horas mediante una vulnerabilidad de inyección SQL en endpoints de API no autenticados.

OpenClawRadar