🔒 Seguridad

Alertas de seguridad y mejores prácticas

Investigadores de la U de T demuestran un gusano de IA potenciable por modelos abiertos gratuitos
Seguridad

Investigadores de la U de T demuestran un gusano de IA potenciable por modelos abiertos gratuitos

Investigadores de la Universidad de Toronto demostraron el primer gusano informático con IA que adapta su estrategia de propagación usando modelos de pesos abiertos accesibles públicamente, apuntando a cualquier dispositivo en línea.

OpenClawRadar
Conceptos de seguridad para Vibe Coding con Claude Code: Autenticación, Autorización y Ejecución
Seguridad

Conceptos de seguridad para Vibe Coding con Claude Code: Autenticación, Autorización y Ejecución

Un ingeniero senior explica autenticación, autorización y enforcement para apps creadas con IA usando la metáfora de un hotel, más cómo pedir a agentes de IA que verifiquen la seguridad.

OpenClawRadar
La función de soporte de IA de Meta permite a cualquiera secuestrar cuentas de Instagram — Detalles del exploit adentro
Seguridad

La función de soporte de IA de Meta permite a cualquiera secuestrar cuentas de Instagram — Detalles del exploit adentro

Una función de soporte de Instagram con IA, en fase de pruebas A/B, permite a atacantes restablecer contraseñas pidiendo al agente que envíe un código a un correo arbitrario. Más de 100 cuentas de alto valor han sido robadas.

OpenClawRadar
PolyRange: Benchmark Ofensivo de IA Resistente a la Contaminación con Objetivos Generados por LLM
Seguridad

PolyRange: Benchmark Ofensivo de IA Resistente a la Contaminación con Objetivos Generados por LLM

PolyRange v1.0 es un benchmark de código abierto (licencia MIT) autohospedable que genera objetivos web frescos en cada ejecución para evitar la contaminación de los datos de entrenamiento. Incluye 84 clases derivadas de WSTG en todas las categorías OWASP, dos niveles de defensa y backends reales.

OpenClawRadar
jqwik v1.10.0 introduce inyección de aviso que elimina código cuando es usado por agentes de IA
Seguridad

jqwik v1.10.0 introduce inyección de aviso que elimina código cuando es usado por agentes de IA

Johannes Link añadió una instrucción oculta a jqwik v1.10.0 que ordena a los agentes de codificación de IA eliminar todos los tests y código de jqwik, oculta con escapes ANSI. Claude la detecta correctamente, pero los usuarios humanos podrían no tener tanta suerte.

OpenClawRadar
Flujo de Aprobación de Administrador Seguro para Asistentes de Chat Grupal contra Inyección de Mensajes
Seguridad

Flujo de Aprobación de Administrador Seguro para Asistentes de Chat Grupal contra Inyección de Mensajes

Un enfoque práctico para proteger asistentes LLM en chats grupales compartidos: pausar herramientas de VM, OAuth y ejecución de código hasta que un administrador apruebe mediante un enlace con tiempo de vida de 10 minutos.

OpenClawRadar
Ataques de Inyección Camuflados en el Dominio Eluden Detectores en Sistemas LLM Multiagente
Seguridad

Ataques de Inyección Camuflados en el Dominio Eluden Detectores en Sistemas LLM Multiagente

Un nuevo estudio muestra que los payloads de inyección adaptados al vocabulario del dominio evaden la detección, reduciendo la IDR del 93,8% al 9,7%. El debate multiagente amplifica los ataques. Llama Guard 3 no detecta ningún payload.

OpenClawRadar
Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA
Seguridad

Sieve: Escáner de Secretos Local para Historiales de Chat de Herramientas de Codificación de IA

Sieve escanea los historiales de chat de Cursor, Claude Code, Copilot y otros asistentes de codificación con IA en busca de claves API y tokens filtrados. Todo el escaneo es local, con redacción y bóveda de llavero de macOS.

OpenClawRadar
Agentes de IA permiten que hackers solitarios vulneren gobiernos y campañas de ransomware
Seguridad

Agentes de IA permiten que hackers solitarios vulneren gobiernos y campañas de ransomware

Un operador solitario que utilizó Claude Code y ChatGPT exfiltró 150 GB de agencias gubernamentales mexicanas, incluyendo 195 millones de registros de contribuyentes. Otro atacante usó Claude Code para ejecutar una campaña de extorsión integral contra 17 organizaciones de atención médica y servicios de emergencia.

OpenClawRadar
Señales de Audio Ocultas Secuestran Sistemas de Voz de IA con una Tasa de Éxito del 79-96%
Seguridad

Señales de Audio Ocultas Secuestran Sistemas de Voz de IA con una Tasa de Éxito del 79-96%

La investigación muestra que clips de audio imperceptibles pueden obligar a los LALM a ejecutar comandos no autorizados como búsquedas web, descargas de archivos y filtración de correos electrónicos con un 79-96% de éxito en 13 modelos, incluidos Mistral y servicios de Microsoft.

OpenClawRadar
Chatbots de IA filtrando números de teléfono reales: El problema de exposición de PII
Seguridad

Chatbots de IA filtrando números de teléfono reales: El problema de exposición de PII

Chatbots como Gemini, ChatGPT y Claude están exponiendo números de teléfono reales debido a la información personal identificable (PII) en los datos de entrenamiento. DeleteMe informa de un aumento del 400% en solicitudes de privacidad relacionadas con IA en siete meses.

OpenClawRadar
Exploit asistido por LLM: la vista previa de Mythos de Anthropic ayudó a construir el primer exploit público del kernel de macOS en Apple M5 en cinco días
Seguridad

Exploit asistido por LLM: la vista previa de Mythos de Anthropic ayudó a construir el primer exploit público del kernel de macOS en Apple M5 en cinco días

Usando la vista previa Mythos de Anthropic, la empresa de seguridad Calif creó el primer exploit público de corrupción de memoria del kernel de macOS en el silicio M5 de Apple en cinco días, rompiendo la seguridad hardware MIE que a Apple le llevó cinco años desarrollar.

OpenClawRadar