Vulnerabilidades de Seguridad de la Función 'Permitir Siempre' de OpenClaw y Alternativas Más Seguras

Vulnerabilidades del Sistema de Aprobación de OpenClaw
El sistema de aprobación de OpenClaw pregunta a los usuarios "¿puedo hacer esto?" antes de ejecutar comandos, con opciones para aprobar una vez o aprobar siempre. La función "permitir siempre" ha sido identificada como un riesgo de seguridad a través de dos CVEs recientes.
Problemas de Seguridad Específicos
CVE-2026-29607: La aprobación "permitir siempre" se vincula al comando wrapper, no al comando interno. Si apruebas time npm test con "siempre", el sistema recuerda "permitir siempre time". Más tarde, si el agente (o mediante inyección de prompt) ejecuta time rm -rf /, se ejecuta sin volver a preguntar porque aprobaste el comando wrapper.
CVE-2026-28460: Esta vulnerabilidad omite por completo la lista de permitidos utilizando caracteres de continuación de línea del shell. Técnica diferente pero mismo resultado: los comandos se ejecutan sin la verificación de aprobación que pensabas que te protegía.
Ambas vulnerabilidades están parcheadas en OpenClaw 3.12+, pero el problema más profundo persiste.
El Problema de Seguridad Conductual
Incluso después del parche, el modelo mental de "permitir siempre" entrena a los usuarios para dejar de prestar atención. Inicialmente, los usuarios leen cuidadosamente cada solicitud de aprobación. Para la semana 3, están haciendo clic en "siempre" en todo porque las solicitudes se vuelven molestas y se genera confianza en el agente. Para la semana 6, los usuarios acumulan 20+ reglas de "siempre" que no podrían enumerar si se les preguntara.
Enfoque Alternativo Recomendado
El autor de la fuente recomienda: no "permitir siempre" para nada que modifique archivos, envíe mensajes o ejecute comandos de shell. En su lugar, agrega barreras explícitas en tu archivo SOUL.md:
"para cualquier acción que modifique archivos, envíe comunicaciones o ejecute comandos de shell: muéstrame exactamente lo que planeas hacer y espera mi ok explícito. las aprobaciones anteriores no se trasladan. pregunta cada vez. esto no es negociable."
Este enfoque significa más toques de "ok" en interfaces como Telegram, pero evita que el agente sea engañado mediante inyección de prompt o su propia alucinación para ejecutar acciones destructivas bajo aprobaciones obsoletas.
Conclusión Clave
El sistema de aprobación es una función de conveniencia que nunca fue diseñada como un límite de seguridad. Trátalo en consecuencia.
📖 Read the full source: r/openclaw
👀 Ver también

La Descubierta de Vulnerabilidades de IA Supera los Tiempos de Implementación de Parches
Un experto en seguridad argumenta que las herramientas de IA como Mythos encontrarán vulnerabilidades más rápido de lo que se puedan implementar las correcciones, citando datos de Log4j que muestran tiempos promedio de remediación de 17 días y un plazo de eliminación de una década.

Posible Incidente de Seguridad de Claude: Alertas de Contraseñas Autoeviadas y Proceso .NET Sospechoso
Un usuario informa haber recibido alertas sospechosas de restablecimiento de contraseña que parecían enviarse desde su propia cuenta después de iniciar sesión en Claude, con correos electrónicos que desaparecieron minutos después y un proceso inusual de .NET que bloqueó el apagado del sistema.

Según informes, la aplicación de Claude para Android lee el portapapeles sin una acción explícita del usuario.
Un usuario reporta que la aplicación Claude para Android analizó código de su portapapeles sin que lo pegaran, con Claude identificando el archivo como pasted_text_b4a56202-3d12-43c8-aa31-a39367a9a354.txt. El comportamiento no pudo reproducirse en pruebas posteriores.

Hackerbot-Claw: Bot de IA que explota flujos de trabajo de GitHub Actions
Un bot impulsado por IA llamado hackerbot-claw ejecutó una campaña de ataque automatizada de una semana contra las canalizaciones CI/CD, logrando la ejecución remota de código en al menos 4 de 6 objetivos, incluidos proyectos de Microsoft, DataDog y CNCF. El bot utilizó 5 técnicas de explotación diferentes y exfiltró un token de GitHub con permisos de escritura.