클로드 코드 플러그인, 로컬에서 토큰 낭비와 이상 징후 분석

한 개발자가 로컬 데이터를 분석하여 Claude Code 세션의 토큰 낭비를 진단하는 claude-token-analyzer라는 Claude Code 플러그인을 만들었습니다. 이 도구는 HighCost, LowCacheHitRate, CostInefficient, ExcessiveToolUse, HighTokenUsage, UnusualModelMix라는 여섯 가지 특정 이상 유형을 탐지하며, 각각 심각도 점수를 부여하여 수정 우선순위를 정합니다.
작동 방식
이 플러그인은 Rust MCP 서버로 구축되어 ~/.claude/projects/**/*.jsonl 파일에서 Claude Code 세션 데이터를 파싱하여 로컬 SQLite 데이터베이스에 저장합니다. 표준 편차 임계값과 복합 이상 탐지를 사용하여 통계 분석을 수행합니다. 이 시스템은 클라우드 구성 요소나 원격 측정 없이 완전히 로컬에서 작동합니다.
발견 사항
8,392개의 세션을 스캔한 결과 1,015개의 이상이 발견되었습니다:
- ExcessiveToolUse가 가장 흔했습니다(320개 세션) - 일반적인 것보다 훨씬 많은 도구 호출
- LowCacheHitRate는 261개 세션에 영향을 미쳤습니다 - 캐싱 없이 프롬프트가 재전송됨
- 66개 세션이 "비용 비효율적"이었습니다 - 높은 비용과 낮은 캐시 적중률이 결합됨
설치 및 사용법
설치 명령: claude plugin install claude-token-analyzer
설치 후 Claude에게 다음과 같이 물어볼 수 있습니다:
- "cta"
- "how much did I spend?"
- "scan for anomalies"
이 플러그인은 7개의 MCP 도구와 6개의 워크플로 스킬을 제공합니다. 또한 중국어(번체) 워크플로 스킬도 포함되어 있어 "看看狀況", "這個月花多少", "有異常嗎"를 입력하여 중국어 분석 보고서를 받을 수 있습니다.
이 도구는 MIT 라이선스 하에 GitHub에서 사용할 수 있습니다: https://github.com/li195111/claude-token-analyzer.
📖 Read the full source: r/ClaudeAI
👀 See Also

Blackwell LLM 툴킷: RTX Pro 6000에서 TensorRT-LLM을 위한 NVFP4 설정, 휠, 및 벤치마크
커뮤니티 저장소는 Blackwell GPU를 위한 TensorRT-LLM 설정, sm_120을 지원하는 사전 빌드된 LMCache 휠, 그리고 벤치마크 결과를 제공합니다. Nemotron-3-Nano-Omni V3는 단일 RTX Pro 6000에서 8k 컨텍스트로 270 tok/s를 기록했습니다.

Discord를 통한 헤드리스 OpenClaw 설정 (Docker 스크립트 사용)
GitHub 저장소에서 OpenClaw를 Discord와 함께 헤드리스 Docker 컨테이너에서 실행하는 스크립트를 제공합니다. TUI/WebUI를 피하며, claw init, start, stop 같은 명령어를 지원하는 관리 스크립트와 OpenAI Responses API, Chromium, 다양한 도구에 대한 사전 구성 지원을 포함합니다.

스펙맥싱: YAML 스펙과 ACAI로 AI 정신병과 싸우기
Acai.sh가 Specsmaxxing을 소개합니다: 요구사항을 YAML로 작성하고 번호가 매겨진 AI 수용 기준(ACAI)을 사용하여 AI 에이전트가 코드에서 참조함으로써 컨텍스트 손실 문제를 해결하는 방법입니다.

OpenHelm: Claude 코드를 위한 자체 수정 재시도 로직이 포함된 로컬 백그라운드 스케줄러
OpenHelm은 Tauri 기반 애플리케이션으로, Claude Code 작업을 백그라운드에서 예약 실행하며, 모든 상태를 SQLite에 로컬로 저장하고, 실패 후 프롬프트를 조정하는 자체 수정 재시도 루프를 포함합니다.