Claudetop: Monitoreo de Costos en Tiempo Real para Sesiones de Código Claude

Claudetop: Monitoreo de Costos en Tiempo Real para Sesiones de Claude Code
Claudetop es una herramienta de monitoreo para Claude Code que muestra el seguimiento de costos en tiempo real, métricas de eficiencia de caché y comparaciones de modelos durante sesiones de codificación. La herramienta fue creada después de que el desarrollador notó una discrepancia donde las estimaciones del modelo mostraban $10 pero la facturación real era $65, con la compactación ocultando el 80% del uso de tokens.
Opciones de Instalación
Hay tres métodos de instalación disponibles:
- Clonar e instalar:
git clone https://github.com/liorwn/claudetop.gitluegocd claudetop && ./install.sh - Comando de una línea:
curl -fsSL https://raw.githubusercontent.com/liorwn/claudetop/main/install.sh | bash - Como un complemento de Claude Code:
claude plugin marketplace add liorwn/claudetopluegoclaude plugin install claudetop
La instalación del complemento proporciona automáticamente el hook SessionEnd más comandos de barra: /claudetop:stats, /claudetop:dashboard, /claudetop:branch, /claudetop:export, y /claudetop:pricing.
Información Mostrada
Durante las sesiones, Claudetop muestra:
- Ubicación y profundidad del proyecto actual
- Modelo activo y duración de la sesión
- Costo actual, tasa de gasto por hora y costo mensual proyectado
- Porcentaje de eficiencia de caché y costo por línea
- Costos comparativos para otros modelos (Opus, Sonnet, Haiku)
- Desglose de tokens: porcentajes de entrada/salida con categorías fresh, cwrite y cread
Características Principales
Seguimiento de costos en tiempo real: Muestra el costo real de la sesión (verde), la tasa de gasto por hora y el pronóstico mensual extrapolado del historial. Los precios se actualizan automáticamente desde pricing.json cuando Anthropic cambia los precios.
Comparación de costos de modelos: Muestra cuánto costaría la sesión en Opus, Sonnet o Haiku con precios conscientes de la caché que tienen en cuenta la proporción real de aciertos de caché. El modelo actual aparece en negrita para una comparación instantánea.
Monitoreo de eficiencia de caché: La proporción de aciertos de caché indica la eficiencia: verde (≥60%) significa que la mayoría de los tokens de entrada se están reutilizando, rojo (<30%) indica que algo está forzando relecturas completas.
Alertas Inteligentes
Las alertas aparecen solo cuando se necesita atención:
- MARCA DE $5 / $10 / $25: Hito de costo superado - verificación rápida de valor
- SOBREPASÓ EL PRESUPUESTO: Presupuesto diario excedido - terminar o cambiar de modelo
- CONSIDERAR SESIÓN NUEVA: >2hrs + >60% de contexto - rendimientos decrecientes
- CACHÉ BAJA: <20% de caché después de 5min - el contexto se reinició, se están releyendo tokens
- TASA DE GASTO: >$15/hr de velocidad - subagentes descontrolados o bucles ajustados
- ¿GIRANDO EN CÍRCULOS?: >$1 gastado, cero salida de código - atascado en bucle de investigación
- PROBAR /fast: >$0.05/línea en Opus - la tarea no necesita el modelo más grande
- COMPACTAR PRONTO: Ventana de contexto >80% llena - compactación automática inminente
Historial y Análisis de Sesiones
Cada sesión se registra automáticamente. Usa claudetop-stats con varios argumentos:
claudetop-stats- Resumen del díaclaudetop-stats week- Esta semanaclaudetop-stats month- Este mesclaudetop-stats all- Todo el tiempoclaudetop-stats tag auth- Filtrar por etiqueta
Esta herramienta es para desarrolladores que usan Claude Code y quieren visibilidad sobre sus patrones de gasto en IA y desean optimizar el uso de modelos y la eficiencia de la caché.
📖 Read the full source: HN AI Agents
👀 Ver también

Corrección de la inflación de contexto en la memoria automática de Claude Code con un esquema de nombres y script de auditoría
Una habilidad de Claude Code impone un esquema de nomenclatura de 3 tipos, metadatos obligatorios y un script de auditoría en bash para deduplicar archivos de memoria y reducir la carga de contexto.

Reduciendo la Latencia del Agente Multimodal al Omitir el Historial de Capturas de Pantalla
Un desarrollador descubrió que omitir capturas de pantalla anteriores de las solicitudes de agentes multimodales y reemplazar los datos de imagen en base64 con cadenas "[imagen omitida]" reduce significativamente la latencia mientras mantiene el rendimiento. El experimento se realizó usando Claude y está documentado en GitHub.

Explorando LiveDocs: Un Cuaderno de Análisis de Datos Nativo de IA
LiveDocs ofrece un entorno de cuaderno reactivo que permite a los equipos de datos realizar análisis de varios pasos y mantener el análisis de principio a fin con la ayuda de un agente de IA.

El Agente Web TinyFish Supera a sus Competidores en la Evaluación de Tareas Web
El agente web de TinyFish logró una tasa de éxito del 81.9% en tareas web difíciles, superando significativamente a competidores como OpenAI Operator, que alcanzó solo un 43.2%.