Claude Code 2.1.136: Seguridad de Acción y Reglas Hard

Claude Code v2.1.136 trae cambios significativos en la seguridad del agente y la aplicación de reglas en el prompt del sistema, el prompt del agente y las descripciones de herramientas. Esto es lo nuevo y cómo afecta el comportamiento del agente autónomo.

Prompt del sistema: Seguridad en acciones e informes veraces

El prompt del sistema actualizado ahora requiere que los agentes busquen confirmación antes de realizar acciones irreversibles o dirigidas al exterior, a menos que esas acciones hayan sido autorizadas de forma duradera. Los agentes deben inspeccionar los objetivos antes de eliminarlos o sobrescribirlos. Los requisitos de informes enfatizan la divulgación fiel de pasos omitidos, pruebas fallidas y resultados verificados, sin omitir fallos.

Prompt del agente: Revisor de reglas del modo automático

Se introduce una nueva categoría de reglas personalizadas hard_deny como cuarta opción junto a las existentes allow, deny y soft_deny. hard_deny bloquea incondicionalmente acciones en el límite de seguridad: la intención del usuario no puede anularlo. La categoría existente soft_deny se reduce para cubrir solo acciones destructivas o irreversibles que la intención clara del usuario puede autorizar.

Prompt del agente: Monitor de seguridad para acciones de agentes autónomos

La lógica del monitor de seguridad se reestructura en dos partes. La primera parte divide el bloqueo en bloqueos duros incondicionales y bloqueos suaves autorizables por el usuario. La regla predeterminada se actualiza y la intención del usuario ya no puede eliminar los límites de seguridad de bloqueo duro. La segunda parte mueve la exfiltración de datos al conjunto de bloqueo duro, agrega cobertura de bloqueo duro para evasiones de verificaciones de seguridad y trata cualquier servicio externo o fuente de descarga adivinada por el agente como no confiable.

Descripción de herramienta: Editar

La descripción de la herramienta Editar ahora restaura el formato de prefijo de número de línea como variable de plantilla, mientras conserva la guía de que los prefijos de línea deben excluirse de las cadenas de edición reales. Es una corrección de limpieza para mantener la coherencia.

Estos cambios refuerzan el perímetro de seguridad para los agentes autónomos de Claude Code. Los desarrolladores que dependen de reglas personalizadas deben actualizar sus configuraciones para aprovechar hard_deny en los bloqueos críticos de seguridad. Los diffs completos de los prompts están disponibles en el lanzamiento.

📖 Lea la fuente completa: r/ClaudeAI

Claude Code 2.1.136: Seguridad de Acción, Reglas de Denegación Estricta y Monitor de Seguridad

Prompt del sistema: Seguridad en acciones e informes veraces

Prompt del agente: Revisor de reglas del modo automático

Prompt del agente: Monitor de seguridad para acciones de agentes autónomos

Descripción de herramienta: Editar

👀 Ver también

Por Qué la Arquitectura Open Source de OpenClaw Importa

Claude Encabeza las Listas de la App Store en Medio del Enfrentamiento Gubernamental

Las autoridades estadounidenses declaran el 'extremismo antitecnológico' como una nueva categoría de amenaza en medio del rechazo a la IA

Claude Code agrega ejecución programada de tareas para flujos de trabajo automatizados