Monk Habilidad: Silencia Narración Agente, Ahorra 54% Tokens

Un usuario de Reddit creó monk, una habilidad que hace que los agentes de IA trabajen en silencio: elimina narraciones, preámbulos, posdatas y comentarios de progreso de las respuestas, conservando solo los resultados. El efecto es una reducción estimada del 54% en los tokens de salida por turno (47% en codificación, 65% en chat, 54% en investigación) y ahorros de contexto compuestos que crecen con la duración de la sesión.

Cómo funciona

monk suprime toda narración del tipo "Ahora estoy haciendo X...", widgets de lista de tareas y pings de estado. El agente solo genera resultados estándar al final de cada paso. La habilidad está disponible en GitHub: github.com/marpxxx/skillz/tree/main/monk.

Resultados de referencia

Las pruebas utilizaron 30 tareas (10 por categoría: codificación, chat, investigación) con la verbosidad aproximada mediante el tokenizador cl100k_base de OpenAI. Cifras clave:

Ahorro de tokens por turno: Codificación 47%, Chat 65%, Investigación 54%, General 54%.
Ganancia de capacidad de contexto (compuesto): En ~20 rondas (sesión típica), +13% (codificación), +14% (chat), +20% (investigación). En 100 rondas, +29% (codificación), +36% (chat), +39% (investigación).
Costo de API (Claude Sonnet 4.6, almacenamiento en caché de instrucciones): ~19% de ahorro en una sesión de 10 rondas.

La prueba no contó los tokens suprimidos en widgets de uso de herramientas o pings de estado, por lo que los ahorros reales podrían ser mayores.

Advertencias

Las muestras verbosas son aproximaciones generadas por IA. Un agente base bien ajustado ya puede ser más escueto; uno verboso con habilidades cargadas de narración puede producir más. El tokenizador es cl100k_base de OpenAI, no el de Anthropic. La suposición de 8k para el prompt del sistema es conservadora (muchas configuraciones tienen 15-30k). Los resultados son estimaciones direccionales, no puntos de referencia de producción.

Para los desarrolladores que rara vez leen la salida del agente en tiempo real, esta habilidad puede reducir el ruido y ampliar significativamente la ventana de contexto.

📖 Leer la fuente completa: r/ClaudeAI

monje: Una habilidad que silencia la narración del agente para ahorrar contexto y tokens

Cómo funciona

Resultados de referencia

Advertencias

👀 Ver también

Cómo construí una habilidad para desplegar agentes OpenClaw en aplicaciones web - Una mirada detrás de cámaras.

Generación de SVG con Qwen3.6-27B y Arnes de Bucle Cerrado

La herramienta de sincronización de documentos/contexto de IA para desarrolladores gana impulso tras una publicación en Reddit.

El complemento de código Claude de código abierto captura libros y los convierte en Markdown estructurado.