Opus 4.7 arruinó el 40% de los prompts; la solución fue estructurar CLAUDE.md y Skills

✍️ OpenClawRadar📅 Publicado: 18 de mayo de 2026🔗 Source
Opus 4.7 arruinó el 40% de los prompts; la solución fue estructurar CLAUDE.md y Skills
Ad

Cuando Opus 4.7 se lanzó en abril, aproximadamente el 40% de las indicaciones en 6 configuraciones de empresas de mercado medio se rompieron de la noche a la mañana. El consumo de tokens aumentó, las salidas se volvieron extrañamente literales — 4.6 solía completar instrucciones ambiguas, pero 4.7 no lo hizo. La solución no fue reescribir las indicaciones; fue finalmente tomarse en serio CLAUDE.md y los archivos Skill.

Qué se rompió y por qué

Las indicaciones escritas para 4.6 asumían que el modelo sería benévolo con instrucciones vagas. 4.7 las interpretó literalmente, generando salidas que necesitaban de 3 a 4 turnos para corregirse. Las indicaciones que sobrevivieron fueron aquellas integradas en archivos Skill con formatos de salida explícitos, límites de longitud y ejemplos prácticos.

El enfoque de la reconstrucción

En las 6 configuraciones se realizaron tres cambios estructurales:

  • Skills reemplazaron indicaciones independientes — cualquier tarea realizada más de 3 veces obtuvo un archivo Skill (50–200 líneas) con audiencia, formato de salida, longitud y un ejemplo práctico de 2-3 oraciones. Los Skills se cargan bajo demanda en lugar de inflar el contexto.
  • CLAUDE.md jerárquico — un archivo global para identidad de usuario, negocio, reglas de voz; un CLAUDE.md a nivel de proyecto por compromiso; instrucciones a nivel de sesión para cosas puntuales. El modelo lee en orden y construye un modelo mental que perdura entre sesiones.
  • Archivos de memoria separados — se mantuvo CLAUDE.md por debajo de 400 líneas; el conocimiento institucional detallado reside en archivos separados a los que CLAUDE.md hace referencia, cargados bajo demanda.
  • Paso de verificación en Skills largos — el modelo genera la salida, la verifica contra una lista de 5 a 7 elementos, y la revisa. Añade 30s por llamada, pero redujo la limpieza posterior en ~70%.
Ad

Resultados después de 3 semanas

  • El promedio de indicación a salida aceptable bajó de 3-4 turnos a 1-2.
  • El uso de tokens se redujo un 22% en los espacios de trabajo.
  • La tasa de "esta salida es rara, déjame intentar de nuevo" bajó de una vez cada 4 indicaciones a una vez cada 15.
  • El próximo lanzamiento del modelo ahora debería ser un neto positivo, no negativo.

Aún sin resolver: versionado de CLAUDE.md

Los archivos a nivel de proyecto están en git, pero el CLAUDE.md global reside en el historial de chat, lo que es frágil. Aún no hay mecanismo de reversión.

Modelo mental

El modelo es el motor. Skills + CLAUDE.md + memoria es el coche. Construye el coche una vez; cada motor nuevo lo hace más rápido.

📖 Lee la fuente completa: r/ClaudeAI

Ad

👀 Ver también