Pasando de las reglas de CLAUDE.md a la aplicación de infraestructura con Citadel

✍️ OpenClawRadar📅 Publicado: 23 de marzo de 2026🔗 Source
Pasando de las reglas de CLAUDE.md a la aplicación de infraestructura con Citadel
Ad

El problema con la acumulación de reglas

Cuando Claude ignoraba las instrucciones, el instinto era agregar más reglas a CLAUDE.md. Comenzando con 45 líneas, creció a 190 líneas en tres meses, pero el cumplimiento empeoró. Las instrucciones más allá de la línea 100 comenzaron a tratarse como sugerencias en lugar de reglas. Una auditoría forense reveló un 40% de redundancia: reglas que decían lo mismo con palabras diferentes, reglas que se contradecían entre sí y reglas obsoletas. Recortar a 123 líneas mejoró el cumplimiento inmediatamente.

El cambio hacia la infraestructura

La solución real fue reconocer que CLAUDE.md es un punto de entrada para la orientación (convenciones del proyecto, pila tecnológica, prioridades clave), no un hogar permanente para todas las reglas. Todo lo demás debería cargarse solo cuando sea necesario. El cambio clave: trasladar la aplicación de las reglas de las instrucciones al entorno.

Por ejemplo, en lugar de una regla que diga "ejecuta siempre la verificación de tipos después de editar un archivo", que Claude seguía de manera inconsistente, un script de gancho del ciclo de vida se ejecuta automáticamente en cada guardado de archivo. Esto asegura que la verificación de tipos ocurra sin que el agente tenga que decidir, mostrando los errores inmediatamente en lugar de 20 ediciones después. Esto redujo drásticamente el tiempo de revisión, permitiendo enfocarse en la intención y el diseño en lugar de perseguir errores de tipo.

El sistema de progresión

El autor describe una progresión de cinco niveles:

  • Nivel 1: Solicitudes en bruto (nada persiste, los mismos errores se repiten)
  • Nivel 2: CLAUDE.md (las reglas ayudan pero alcanzan un límite alrededor de 100 líneas)
  • Nivel 3: Habilidades (experiencia modular que se carga bajo demanda, cero tokens cuando está inactiva)
  • Nivel 4: Ganchos (el entorno aplica la calidad, no las instrucciones)
  • Nivel 5: Orquestación (agentes paralelos, campañas persistentes, oleadas coordinadas)

La mayoría de los proyectos están bien en el Nivel 2 o 3. La idea crítica: cuando CLAUDE.md deja de funcionar, la respuesta no es agregar más reglas, sino trasladar la aplicación a la infraestructura.

Ad

Implementaciones específicas

El autor implementó tres sistemas clave:

  • Habilidades: Archivos Markdown que codifican patrones, restricciones y ejemplos para dominios específicos. El agente carga las habilidades relevantes para la tarea actual, evitando el desperdicio de tokens en contexto irrelevante.
  • Archivos de campaña: Documentos estructurados que rastrean lo que se construyó, las decisiones tomadas y lo que queda. Estos persisten entre sesiones, eliminando las reexplicaciones diarias.
  • Ganchos automatizados: Verificación de tipos en cada edición, escaneo de antipatrones al final de la sesión, interruptor de circuito que termina el agente después de 3 fallos repetidos en el mismo problema, y protección de compactación que guarda el estado antes de que Claude comprima el contexto.

Citadel: El sistema de código abierto

El sistema completo, llamado Citadel, se ha publicado como código abierto en https://github.com/SethGammon/Citadel. Incluye el sistema de habilidades, ganchos, persistencia de campañas y un comando /do que enruta las tareas al nivel de orquestación correcto automáticamente. Construido a partir de 27 fallos documentados en 198 agentes en una base de código de 668K líneas, cada regla se remonta a algo que se rompió.

📖 Read the full source: r/ClaudeAI

Ad

👀 Ver también

Smriti: Un sistema similar a Git para gestionar el estado del razonamiento de LLM y prevenir la deriva en las conversaciones.
Herramientas

Smriti: Un sistema similar a Git para gestionar el estado del razonamiento de LLM y prevenir la deriva en las conversaciones.

Smriti es una herramienta de código abierto que permite a los desarrolladores guardar, restaurar, ramificar y comparar estados de razonamiento en conversaciones con LLM para prevenir la deriva. Trata las interacciones como estado en lugar de historial de chat, permitiendo retrocesos limpios y exploración alternativa sin contaminación.

OpenClawRadar
Usando el kit de herramientas Obliteratus para eliminar los pesos de rechazo de los modelos de IA.
Herramientas

Usando el kit de herramientas Obliteratus para eliminar los pesos de rechazo de los modelos de IA.

Un usuario de Reddit utilizó el kit de herramientas Obliteratus para eliminar quirúrgicamente pesos específicos responsables del comportamiento de rechazo en modelos de IA, demostrando en el modelo Qwen 1.5B de Alibaba que puede revelar los orígenes del entrenamiento sin necesidad de reentrenar.

OpenClawRadar
Desarrollador Crea Habilidades Prácticas de Claude para Proyectos Kotlin Multiplataforma
Herramientas

Desarrollador Crea Habilidades Prácticas de Claude para Proyectos Kotlin Multiplataforma

Un desarrollador creó un repositorio público de habilidades de Claude específicamente para el trabajo con Kotlin Multiplatform después de encontrar que las habilidades existentes eran demasiado genéricas, subjetivas o superficiales. Las habilidades cubren revisiones de arquitectura, implementación de características, modularización, interfaz de usuario de Compose Multiplatform, navegación, puentes de plataforma, enlaces profundos, interfaz de usuario adaptable, pruebas y gobernanza de compilación.

OpenClawRadar
Universal CLAUDE.md reduce los tokens de salida de Claude en un 63% en pruebas comparativas.
Herramientas

Universal CLAUDE.md reduce los tokens de salida de Claude en un 63% en pruebas comparativas.

Un desarrollador creó un archivo universal CLAUDE.md que reduce la salida de tokens de Claude en un 63% en cinco pruebas de referencia, manteniendo la precisión técnica. El archivo aborda comportamientos comunes de Claude como respuestas verbosas, formato innecesario y sugerencias no solicitadas.

OpenClawRadar