Auditoría de Seguridad Encuentra Vulnerable los Servidores de Referencia MCP de Anthropic, Introduce Vulnerabilidades Basadas en Alucinaciones

✍️ OpenClawRadar📅 Publicado: 30 de marzo de 2026🔗 Source
Auditoría de Seguridad Encuentra Vulnerable los Servidores de Referencia MCP de Anthropic, Introduce Vulnerabilidades Basadas en Alucinaciones
Ad

Resultados de la Auditoría de Seguridad de Servidores MCP

Una auditoría de seguridad exhaustiva de 100 paquetes de servidores del Protocolo de Contexto de Modelo (MCP) reveló problemas de seguridad significativos. La auditoría encontró que el 71% de los servidores obtuvo una calificación F, sin que ningún servidor recibiera una calificación A. Esto incluye las propias implementaciones de referencia de Anthropic que a menudo se consideran el "Estándar de Oro".

Vulnerabilidades Basadas en Alucinaciones (HBVs)

La auditoría identificó una nueva clase de vulnerabilidad llamada Vulnerabilidades Basadas en Alucinaciones. Cuando las herramientas MCP tienen descripciones vagas (como "gestiona archivos"), Claude se ve forzado a adivinar parámetros. Esto crea tanto vulnerabilidades de seguridad como desperdicio de tokens, ya que Claude entra en "bucles de razonamiento" tratando de determinar los límites de las herramientas, consumiendo ventanas de contexto y límites de mensajes.

Hallazgos Específicos

  • La Trampa de Referencia: Los servidores oficiales para GitHub y sistemas de archivos—los que Anthropic recomienda—obtuvieron 0/100 en pruebas de seguridad básicas. Estos servidores permiten entradas "ilimitadas", lo que significa que los agentes impulsados pueden ser engañados para eliminar o extraer datos debido a la falta de barreras de seguridad internas.
  • Riesgos de Clase RCE: La auditoría identificó precursores estructurales de vulnerabilidades RCE similares a CVE-2025-68143 que anteriormente afectaron al ecosistema.
  • Limitaciones de Autenticación: Incluso con OAuth configurado, las herramientas mal definidas permanecen vulnerables. Indicaciones sofisticadas pueden convertir a Claude en una herramienta para la destrucción accidental o intencional de datos.
Ad

Recomendaciones de Protección

  • Audita tus servidores: No confíes en los servidores solo porque estén en el repositorio oficial de Anthropic.
  • Refuerza tus manifiestos: Asegúrate de que cada herramienta tenga minLength, maxLength y una expresión regular estricta pattern en su esquema JSON.
  • Ejecuta el Escáner: Usa la herramienta de auditoría de código abierto: npx @agentsid/scanner

Conclusión Principal

Las configuraciones agentes probablemente son "vulnerables por defecto" porque las plantillas oficiales priorizan la flexibilidad sobre la seguridad. Endurecer adecuadamente las definiciones de herramientas puede tanto proteger los datos como reducir el consumo de tokens al prevenir bucles de razonamiento innecesarios.

El documento técnico completo y la metodología están disponibles en: https://github.com/stevenkozeniesky02/agentsid-scanner/blob/master/docs/state-of-agent-security-2026.md

📖 Read the full source: r/ClaudeAI

Ad

👀 Ver también

Chatbots de IA filtrando números de teléfono reales: El problema de exposición de PII
Seguridad

Chatbots de IA filtrando números de teléfono reales: El problema de exposición de PII

Chatbots como Gemini, ChatGPT y Claude están exponiendo números de teléfono reales debido a la información personal identificable (PII) en los datos de entrenamiento. DeleteMe informa de un aumento del 400% en solicitudes de privacidad relacionadas con IA en siete meses.

OpenClawRadar
820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw
Seguridad

820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw

Investigadores de seguridad identificaron 820 habilidades en el mercado ClawHub de OpenClaw que contienen malware confirmado, incluyendo keyloggers, scripts de exfiltración de datos y comandos de shell ocultos. Estas habilidades pueden ejecutar código e interactuar con el entorno local, creando riesgos de seguridad en la cadena de suministro.

OpenClawRadar
Traducción al español:

**La aplicación de escritorio Claude de Anthropic instala un puente de mensajería nativa no revelado**
Seguridad

Traducción al español: **La aplicación de escritorio Claude de Anthropic instala un puente de mensajería nativa no revelado**

Claude Desktop instala silenciosamente una extensión de navegador preautorizada que permite la mensajería nativa, generando preocupaciones de seguridad.

OpenClawRadar
Presentamos SkillFence: El nuevo monitor en tiempo de ejecución que observa lo que realmente hacen las habilidades.
Seguridad

Presentamos SkillFence: El nuevo monitor en tiempo de ejecución que observa lo que realmente hacen las habilidades.

SkillFence ofrece un avance en el monitoreo de las acciones de los agentes de IA, abordando la necesidad de transparencia y seguridad en entornos impulsados por IA. Descubre cómo esta herramienta innovadora puede mejorar el control sobre procesos autónomos.

OpenClawRadar