monje: Una habilidad que silencia la narración del agente para ahorrar contexto y tokens

Un usuario de Reddit creó monk, una habilidad que hace que los agentes de IA trabajen en silencio: elimina narraciones, preámbulos, posdatas y comentarios de progreso de las respuestas, conservando solo los resultados. El efecto es una reducción estimada del 54% en los tokens de salida por turno (47% en codificación, 65% en chat, 54% en investigación) y ahorros de contexto compuestos que crecen con la duración de la sesión.
Cómo funciona
monk suprime toda narración del tipo "Ahora estoy haciendo X...", widgets de lista de tareas y pings de estado. El agente solo genera resultados estándar al final de cada paso. La habilidad está disponible en GitHub: github.com/marpxxx/skillz/tree/main/monk.
Resultados de referencia
Las pruebas utilizaron 30 tareas (10 por categoría: codificación, chat, investigación) con la verbosidad aproximada mediante el tokenizador cl100k_base de OpenAI. Cifras clave:
- Ahorro de tokens por turno: Codificación 47%, Chat 65%, Investigación 54%, General 54%.
- Ganancia de capacidad de contexto (compuesto): En ~20 rondas (sesión típica), +13% (codificación), +14% (chat), +20% (investigación). En 100 rondas, +29% (codificación), +36% (chat), +39% (investigación).
- Costo de API (Claude Sonnet 4.6, almacenamiento en caché de instrucciones): ~19% de ahorro en una sesión de 10 rondas.
La prueba no contó los tokens suprimidos en widgets de uso de herramientas o pings de estado, por lo que los ahorros reales podrían ser mayores.
Advertencias
Las muestras verbosas son aproximaciones generadas por IA. Un agente base bien ajustado ya puede ser más escueto; uno verboso con habilidades cargadas de narración puede producir más. El tokenizador es cl100k_base de OpenAI, no el de Anthropic. La suposición de 8k para el prompt del sistema es conservadora (muchas configuraciones tienen 15-30k). Los resultados son estimaciones direccionales, no puntos de referencia de producción.
Para los desarrolladores que rara vez leen la salida del agente en tiempo real, esta habilidad puede reducir el ruido y ampliar significativamente la ventana de contexto.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Integración de memoria local de Claude Code con Shodh: Mejorando la retención de contexto a lo largo del tiempo.
Explora la integración de Claude Code con la memoria Shodh para la retención de contexto de proyectos a largo plazo utilizando un servidor de memoria local.

graphify-ts: El servidor MCP local reduce los tokens de revisión de PR de Claude Code de 63K a 8.7K
graphify-ts construye un grafo de conocimiento local de tu código fuente usando tree-sitter AST + comunidades Louvain + BM25 + rerank opcional ONNX, exponiéndolo a través de MCP stdio. En pruebas de producción, redujo los tokens de entrada en 2.6x y la latencia en 2.8x para consultas de código, y recortó los prompts de revisión de PR de 63K a 8.7K tokens.

La extensión OpenClaw enruta las solicitudes a través de la CLI de Claude Code en lugar de la API.
Una extensión de OpenClaw ejecuta el binario CLI de Claude como un subproceso, enrutando las solicitudes a través de Claude Code CLI en lugar de la API de Anthropic. Esto proporciona la experiencia completa de Claude Code a la tarifa plana de un plan máximo.

Claudigotchi: Dispositivo Físico Tamagotchi que se Alimenta de la Actividad de Código Claude
Claudigotchi es una criatura física de escritorio que funciona con un ESP32 y una pantalla LCD, y se conecta a Claude Code mediante un complemento. El sistema de hambre del dispositivo responde a la actividad de programación, con estados visuales y efectos de sonido que aumentan cuando Claude se deja inactivo.