Claudetop: Monitoramento de Custos em Tempo Real para Sessões de Código Claude

Claudetop: Monitoramento de Custos em Tempo Real para Sessões do Claude Code
Claudetop é uma ferramenta de monitoramento para o Claude Code que exibe o rastreamento de custos em tempo real, métricas de eficiência do cache e comparações de modelos durante sessões de programação. A ferramenta foi criada depois que o desenvolvedor percebeu uma discrepância onde as estimativas do modelo mostravam US$ 10, mas a cobrança real foi de US$ 65, com a compactação ocultando 80% do uso de tokens.
Opções de Instalação
Três métodos de instalação estão disponíveis:
- Clonar e instalar:
git clone https://github.com/liorwn/claudetop.gitdepoiscd claudetop && ./install.sh - Uma linha:
curl -fsSL https://raw.githubusercontent.com/liorwn/claudetop/main/install.sh | bash - Como um plugin do Claude Code:
claude plugin marketplace add liorwn/claudetopdepoisclaude plugin install claudetop
A instalação do plugin fornece o hook SessionEnd mais comandos de barra automaticamente: /claudetop:stats, /claudetop:dashboard, /claudetop:branch, /claudetop:export e /claudetop:pricing.
Informações Exibidas
Durante as sessões, o Claudetop mostra:
- Localização e profundidade do projeto atual
- Modelo ativo e duração da sessão
- Custo atual, taxa de consumo por hora e custo mensal projetado
- Porcentagem de eficiência do cache e custo por linha
- Custos comparativos para outros modelos (Opus, Sonnet, Haiku)
- Detalhamento de tokens: porcentagens de entrada/saída com categorias fresh, cwrite e cread
Principais Funcionalidades
Rastreamento de custos em tempo real: Mostra o custo real da sessão (verde), taxa de consumo por hora e previsão mensal extrapolada do histórico. Os preços são atualizados automaticamente a partir do pricing.json quando a Anthropic altera os preços.
Comparação de custos de modelos: Exibe quanto a sessão custaria no Opus, Sonnet ou Haiku com preços conscientes do cache que consideram a taxa real de acertos do cache. O modelo atual é destacado em negrito para comparação instantânea.
Monitoramento de eficiência do cache: A taxa de acertos do cache indica a eficiência: verde (≥60%) significa que a maioria dos tokens de entrada está sendo reutilizada, vermelho (<30%) indica que algo está forçando releituras completas.
Alertas Inteligentes
Os alertas aparecem apenas quando a atenção é necessária:
- MARCA DE US$ 5 / US$ 10 / US$ 25: Marco de custo ultrapassado - verificação rápida de valor
- ACIMA DO ORÇAMENTO: Orçamento diário excedido - finalize ou troque de modelos
- CONSIDERE UMA SESSÃO FRESCA: >2h + >60% de contexto - retornos decrescentes
- CACHE BAIXO: <20% de cache após 5min - o contexto foi redefinido, tokens estão sendo relidos
- TAXA DE CONSUMO: >US$ 15/h de velocidade - subagentes descontrolados ou loops apertados
- GIRANDO?: >US$ 1 gasto, zero saída de código - preso em loop de pesquisa
- TENTE /fast: >US$ 0,05/linha no Opus - a tarefa não precisa do maior modelo
- COMPACTAR EM BREVE: Janela de contexto >80% cheia - compactação automática iminente
Histórico e Análises da Sessão
Cada sessão é registrada automaticamente. Use claudetop-stats com vários argumentos:
claudetop-stats- Resumo de hojeclaudetop-stats week- Esta semanaclaudetop-stats month- Este mêsclaudetop-stats all- Todo o tempoclaudetop-stats tag auth- Filtrar por tag
Esta ferramenta é para desenvolvedores que usam o Claude Code e desejam visibilidade sobre seus padrões de gastos com IA e querem otimizar o uso de modelos e a eficiência do cache.
📖 Read the full source: HN AI Agents
👀 See Also

Bots Gerais: Plataforma de agente de IA de código aberto para automação empresarial auto-hospedada
General Bots é uma plataforma de código aberto iniciada em 2019 que fornece agentes de IA, automação de fluxos de trabalho, processamento de documentos e integrações com suporte a modelos de IA locais, projetada para organizações que precisam de controle total sobre sua infraestrutura.

Membase: Camada de Memória Externa para Assistentes de IA em Diferentes Ferramentas
Membase é uma camada de memória externa que extrai e armazena o contexto das conversas em um grafo de conhecimento, depois injeta memórias relevantes em novos chats no Claude, ChatGPT, Cursor, Gemini e outras ferramentas de IA. Atualmente está em beta privado com todos os recursos gratuitos.

Microsoft BitNet: framework de inferência de LLM de 1 bit para CPU e GPU
A Microsoft lançou o BitNet, uma estrutura de inferência para LLMs de 1 bit que alcança acelerações de 1,37x a 6,17x em CPUs e reduz o consumo de energia em 55,4% a 82,2%. Ela pode executar um modelo de 100 bilhões de parâmetros em uma única CPU a 5-7 tokens por segundo.

Quatro Habilidades do ClawHub para Dados de Busca em Tempo Real em Agentes de IA
Quatro habilidades do ClawHub oferecem capacidades de busca estruturada para agentes de IA: Google (web, notícias, imagens, mapas), Amazon (busca de produtos em 12 marketplaces), Walmart (busca de produtos com filtros de entrega) e YouTube (busca de vídeos com transcrições). Instale via comandos clawhub install com uma única chave de API.