Auditoría de Seguridad Encuentra Vulnerable los Servidores de Referencia MCP de Anthropic, Introduce Vulnerabilidades Basadas en Alucinaciones

Resultados de la Auditoría de Seguridad de Servidores MCP
Una auditoría de seguridad exhaustiva de 100 paquetes de servidores del Protocolo de Contexto de Modelo (MCP) reveló problemas de seguridad significativos. La auditoría encontró que el 71% de los servidores obtuvo una calificación F, sin que ningún servidor recibiera una calificación A. Esto incluye las propias implementaciones de referencia de Anthropic que a menudo se consideran el "Estándar de Oro".
Vulnerabilidades Basadas en Alucinaciones (HBVs)
La auditoría identificó una nueva clase de vulnerabilidad llamada Vulnerabilidades Basadas en Alucinaciones. Cuando las herramientas MCP tienen descripciones vagas (como "gestiona archivos"), Claude se ve forzado a adivinar parámetros. Esto crea tanto vulnerabilidades de seguridad como desperdicio de tokens, ya que Claude entra en "bucles de razonamiento" tratando de determinar los límites de las herramientas, consumiendo ventanas de contexto y límites de mensajes.
Hallazgos Específicos
- La Trampa de Referencia: Los servidores oficiales para GitHub y sistemas de archivos—los que Anthropic recomienda—obtuvieron 0/100 en pruebas de seguridad básicas. Estos servidores permiten entradas "ilimitadas", lo que significa que los agentes impulsados pueden ser engañados para eliminar o extraer datos debido a la falta de barreras de seguridad internas.
- Riesgos de Clase RCE: La auditoría identificó precursores estructurales de vulnerabilidades RCE similares a CVE-2025-68143 que anteriormente afectaron al ecosistema.
- Limitaciones de Autenticación: Incluso con OAuth configurado, las herramientas mal definidas permanecen vulnerables. Indicaciones sofisticadas pueden convertir a Claude en una herramienta para la destrucción accidental o intencional de datos.
Recomendaciones de Protección
- Audita tus servidores: No confíes en los servidores solo porque estén en el repositorio oficial de Anthropic.
- Refuerza tus manifiestos: Asegúrate de que cada herramienta tenga
minLength,maxLengthy una expresión regular estrictapatternen su esquema JSON. - Ejecuta el Escáner: Usa la herramienta de auditoría de código abierto:
npx @agentsid/scanner
Conclusión Principal
Las configuraciones agentes probablemente son "vulnerables por defecto" porque las plantillas oficiales priorizan la flexibilidad sobre la seguridad. Endurecer adecuadamente las definiciones de herramientas puede tanto proteger los datos como reducir el consumo de tokens al prevenir bucles de razonamiento innecesarios.
El documento técnico completo y la metodología están disponibles en: https://github.com/stevenkozeniesky02/agentsid-scanner/blob/master/docs/state-of-agent-security-2026.md
📖 Read the full source: r/ClaudeAI
👀 Ver también

Chatbots de IA filtrando números de teléfono reales: El problema de exposición de PII
Chatbots como Gemini, ChatGPT y Claude están exponiendo números de teléfono reales debido a la información personal identificable (PII) en los datos de entrenamiento. DeleteMe informa de un aumento del 400% en solicitudes de privacidad relacionadas con IA en siete meses.

820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw
Investigadores de seguridad identificaron 820 habilidades en el mercado ClawHub de OpenClaw que contienen malware confirmado, incluyendo keyloggers, scripts de exfiltración de datos y comandos de shell ocultos. Estas habilidades pueden ejecutar código e interactuar con el entorno local, creando riesgos de seguridad en la cadena de suministro.

Traducción al español: **La aplicación de escritorio Claude de Anthropic instala un puente de mensajería nativa no revelado**
Claude Desktop instala silenciosamente una extensión de navegador preautorizada que permite la mensajería nativa, generando preocupaciones de seguridad.

Presentamos SkillFence: El nuevo monitor en tiempo de ejecución que observa lo que realmente hacen las habilidades.
SkillFence ofrece un avance en el monitoreo de las acciones de los agentes de IA, abordando la necesidad de transparencia y seguridad en entornos impulsados por IA. Descubre cómo esta herramienta innovadora puede mejorar el control sobre procesos autónomos.