Claudlytics: Painel Autohospedado para Monitorar o Uso de Tokens e Custos do Código Claude

O que o Claudlytics faz
Claudlytics é um painel auto-hospedado que monitora o uso de tokens e os custos do Claude Code em tempo real. É especialmente útil para desenvolvedores que executam o Claude Code sem interface gráfica em VPS ou servidores remotos, onde o rastreamento local da máquina do aplicativo de desktop não é suficiente.
Como funciona
O Claude Code grava cada conversa em arquivos ~/.claude/projects/**/*.jsonl. O Claudlytics lê esses arquivos, analisa o uso de tokens e calcula os custos usando o preço do Sonnet 4.6. Nenhuma chamada à API do Claude é necessária para o uso básico — tudo é processado localmente.
Recursos do painel
- Contagem de tokens e custo da sessão atual
- Janela de uso de 5 horas com contagem regressiva de reinício (alinhada aos limites de sessão do Claude Pro/Max)
- Detalhamentos de hoje / últimos 7 dias / ciclo de faturamento
- Contagens de mensagens por sessão e semanais
Configuração e instalação
A configuração requer três comandos:
git clone https://github.com/iansugerman/Claudlytics.git
cd Claudlytics
node server.jsApós executar esses comandos, abra http://localhost:3031 no seu navegador.
Segurança e acesso remoto
O servidor se conecta apenas a 127.0.0.1, portanto nunca fica exposto publicamente. Para acesso a servidores remotos, use um túnel SSH:
ssh -L 3031:localhost:3031 user@your-serverEm seguida, navegue até localhost:3031 na sua máquina local.
Implantação em produção
O Claudlytics pode ser executado como um serviço systemd para disponibilidade em segundo plano. Instruções completas estão disponíveis no README do repositório GitHub.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Técnica de Double-Buffering para Janelas de Contexto de LLM Elimina a Compactação "Stop-the-World"
Uma técnica chamada de double-buffering pode impedir que agentes de LLM congelem durante a compactação da janela de contexto, resumindo antecipadamente e mantendo dois buffers, permitindo uma transição perfeita sem custo adicional de inferência.

Fantasma: Um Agente de IA Persistente Construído com o SDK de Agente do Claude
Phantom é um processo de código aberto em Bun/TypeScript que envolve o SDK de Agente do Claude (Opus 4.6) com memória vetorial persistente, um mecanismo de auto-evolução e uma interface de servidor MCP. Ele roda continuamente em sua própria VM ou Docker Compose e se comunica via Slack.

cortex-engine MCP server adiciona suporte a memória persistente e multiagente
cortex-engine v0.4.0 é um servidor MCP de código aberto que fornece aos agentes de IA memória de longo prazo persistente com ferramentas como observe(), query(), believe() e dream(). Agora ele suporta múltiplos agentes com namespaces de memória isolados.

Gemma 4 26B vs Qwen 3.5 27B: Benchmark de Fluxo de Trabalho Empresarial Local em RTX 4090
Um desenvolvedor testou o Gemma 4 26B e o Qwen 3.5 27B em uma estação de trabalho RTX 4090 para 18 tarefas reais de operador de negócios. O Gemma venceu por 13 a 5, mostrando velocidade mais rápida e melhor disciplina para trabalho de execução diária, enquanto o Qwen se destacou em pensamento estratégico mais amplo.