Medición del gasto de tokens fuera de tarea en Claude Code: La métrica de 'intención no declarada'

Un desarrollador que construye hooks personalizados para Claude Code creó una métrica llamada gasto de intención no declarada para medir el uso de tokens fuera del objetivo declarado.
Hallazgos clave
- En una sesión, el cómputo total fue de 5,137 tokens, con 1,173 (22.8%) clasificados como no declarados y 3,964 (77.2%) como declarados.
- El gasto no declarado captura el costo de reintentos, bucles, desviación de razonamiento y ejecución fuera de tarea, no solo violaciones de gobernanza.
- La métrica trata el costo como una señal de comportamiento, no solo telemetría de facturación.
Desafío de implementación
La superficie del hook no siempre expone suficiente contexto para distinguir la desviación real de la intención indeterminable. El autor señala dos modos de falla distintos: desviación genuina (se metió en archivos/sistemas no relacionados) vs. indeterminable desde los datos del hook. Se necesitan respuestas diferentes según el modo.
Formato de salida de ejemplo:
Total compute 5,137 tokens
Undeclared 1,173 tokens (22.8%)
Declared 3,964 tokens (77.2%)
No se comparte ninguna herramienta o biblioteca en la fuente; la publicación es un tema de discusión. El autor está interesado en si otros están midiendo el cómputo fuera de tarea o si aún tratan el gasto de tokens como mera facturación/optimización.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Forge: un IDE basado en Claude con verificación automatizada y ADN de proyecto.
Forge es un IDE basado en Claude construido sobre VS Code que ejecuta automáticamente verificaciones de tipos, pruebas, comprobaciones de cobertura y validación de importaciones antes de mostrar el código. Incluye bucles de autocorrección para verificaciones fallidas y construye un ADN del Proyecto de los patrones de tu base de código.

PocketBot: IA compila automatizaciones a JavaScript para una programación determinista y rentable
PocketBot aborda los problemas de costos de API y hardware compilando solicitudes en lenguaje natural en scripts de JavaScript autónomos que se ejecutan en programaciones sin llamadas a LLM en tiempo de ejecución. La herramienta usa IA solo una vez para escribir el código, luego se ejecuta de manera determinista con más de 20 integraciones incluyendo Google Suite, Slack y Notion.
Uso de Claude 3.0.0: Rastreador de barra de menú de código abierto para macOS para Claude y Codex
Usage4Claude 3.0.0 añade soporte opcional para Codex, inicio de sesión integrado en el navegador para Claude, cambio entre múltiples cuentas y notificaciones localizadas.

Benchmark Flash-MOE en M5 Max: 12.99 tok/s con Qwen3.5-397B
Una evaluación comparativa del modelo Qwen3.5 de 397 mil millones de parámetros ejecutándose localmente en un MacBook Pro M5 Max con 128 GB de RAM logró 12.99 tokens por segundo utilizando cuantización de 4 bits y cache-io-split 4, tres veces más rápido que la evaluación original de 48 GB.