Cómo Arreglar los Tiempos de Respuesta de OpenClaw Reduciendo la Hinchazón del Contexto

✍️ OpenClawRadar📅 Publicado: 24 de febrero de 2026🔗 Source
Cómo Arreglar los Tiempos de Respuesta de OpenClaw Reduciendo la Hinchazón del Contexto
Ad

Problema: Truncamiento Silencioso del Contexto que Causa Respuestas Lentas

Un desarrollador que ejecutaba OpenClaw 24/7 en un Mac Mini M4 experimentó tiempos de respuesta de 10 minutos a mensajes simples. La investigación reveló que el archivo de arranque del espacio de trabajo MEMORY.md tenía 26,421 caracteres (superando el límite de 20,000 caracteres) y estaba siendo truncado silenciosamente en el contexto inyectado. Aproximadamente 47,000 caracteres de archivos del espacio de trabajo se estaban inyectando en cada mensaje antes de cualquier entrada del usuario, con MEMORY.md solo en 26,755 caracteres.

Causas Raíz Identificadas

  • MEMORY.md contenía comandos de implementación completos, desgloses financieros y descripciones verbosas de proyectos en lugar de servir como un índice
  • Los archivos estándar del espacio de trabajo estaban inflados con contenido duplicado (AGENTS.md tenía instrucciones que duplicaban indicaciones del sistema, TOOLS.md contenía grupos de Telegram ya en MEMORY.md)
  • Sin límites estrictos en los tamaños de archivos, permitiendo que los archivos se desviaran hasta alcanzar el límite predeterminado de bootstrapMaxChars de 20,000 y se truncaran silenciosamente

Resultados de la Reestructuración de Archivos

El desarrollador reestructuró los archivos utilizando el principio de que MEMORY.md debe contener solo referencias. Si la información puede consultarse en un archivo de proyecto cuando sea necesario, no pertenece a MEMORY.md.

  • MEMORY.md: Reducido de 26,755 caracteres a 3,456 caracteres
  • AGENTS.md: Reducido de 8,436 caracteres a 2,538 caracteres
  • TOOLS.md: Reducido de 4,468 caracteres a 2,350 caracteres
  • Contexto inyectado total: Reducido de ~47k caracteres a ~16k caracteres

Se crearon archivos no estándar (PROJECTS.md, LESSONS.md, VOICE.md) para el estado de proyectos, IDs de Telegram, automatizaciones e infraestructura. Estos archivos no se inyectan automáticamente pero son consultables mediante memory_search cuando son relevantes.

Ad

Cambios de Configuración

Agregar estas configuraciones a ~/.openclaw/openclaw.json bajo agents.defaults:

{
  "bootstrapMaxChars": 8000,
  "bootstrapTotalMaxChars": 40000,
  "compaction": {
    "mode": "safeguard",
    "reserveTokensFloor": 20000,
    "memoryFlush": {
      "enabled": true,
      "softThresholdTokens": 4000,
      "systemPrompt": "La sesión se acerca a la compactación. Almacena recuerdos duraderos ahora.",
      "prompt": "Escribe cualquier nota duradera en memory/YYYY-MM-DD.md; responde con NO_REPLY si no hay nada que almacenar."
    }
  },
  "memorySearch": {
    // La configuración continúa desde la fuente
  }
}

Perspectivas de Investigación

El desarrollador investigó múltiples fuentes antes de implementar los cambios:

  • Documentación oficial de OpenClaw para memory.md, agent-workspace.md, documentación de compactación y documentación de contexto
  • Publicación en r/AI_Agents "8 Ways OpenClaw Reduces Context Loss in Long-Running Agents" con la perspectiva: "El contexto es un nuevo tipo de recurso, como la RAM."
  • Publicación en r/ClaudeAI "How I solved context loss in long-running Claude agent sessions" que introdujo reserveTokensFloor y un marcador de sesión liviano conversation-state.md
  • Artículo de Arxiv 2602.11988v1 sobre gestión de memoria de agentes encontró que los archivos de contexto reducen las tasas de éxito de tareas en ~3% y aumentan los costos de inferencia en 20%+

📖 Leer la fuente completa: r/clawdbot

Ad

👀 Ver también

Optimizando GLM-4.7-Flash en M4 Mac Mini con 24GB de RAM
Guías

Optimizando GLM-4.7-Flash en M4 Mac Mini con 24GB de RAM

Un desarrollador comparte detalles específicos de configuración para ejecutar GLM-4.7-Flash en una Mac Mini M4 con 24 GB de RAM, incluyendo cuantización Q3_K_XL, tamaño de contexto de 32k con MLA, y realidades de asignación de memoria para Metal.

OpenClawRadar
12 Consejos para Usuarios Expertos de OpenClaw para Flujos de Trabajo Eficientes con Agentes de IA
Guías

12 Consejos para Usuarios Expertos de OpenClaw para Flujos de Trabajo Eficientes con Agentes de IA

Una publicación de Reddit describe estrategias prácticas para optimizar el uso de OpenClaw, incluyendo dividir conversaciones en hilos específicos por tema, usar notas de voz para entrada, emparejar modelos con tareas, delegar trabajo a subagentes e implementar capas de seguridad.

OpenClawRadar
Qwen3.5-397B MoE se ejecuta con 14 GB de RAM mediante carga experta paginada en M1 Ultra
Guías

Qwen3.5-397B MoE se ejecuta con 14 GB de RAM mediante carga experta paginada en M1 Ultra

El motor MoE paginado mantiene solo 20 expertos residentes y carga el resto desde SSD bajo demanda, ejecutando un modelo de 397B y 209GB en un Mac Studio de 64GB con 1.59 tok/s y 14GB de RAM pico. Incluye benchmarks de modelos más pequeños.

OpenClawRadar
Configurando OpenClaw para una Comunicación Fluida entre Agentes
Guías

Configurando OpenClaw para una Comunicación Fluida entre Agentes

Un usuario de Reddit comparte configuraciones específicas para OpenClaw que reducen los tiempos de espera en la comunicación entre agentes, incluyendo ajustes de visibilidad de herramientas, directivas de memoria y soluciones para la limitación ANNOUNCE_SKIP.

OpenClawRadar