PRECC 도구, 사전 도구 호출 압축으로 Claude 코드 API 비용 절감

PRECC는 Claude Code API 비용을 줄이는 오픈 소스 도구로, 모델에 도달하기 전에 중복 컨텍스트를 압축합니다. Bash, Read, Grep 호출을 가로채는 사전 도구 호출 훅을 사용하여 압축 알고리즘을 적용합니다.
작동 방식
이 도구는 중복 컨텍스트가 여러 번 전송되어 API 비용이 증가하는 비용 문제를 해결합니다. 일반적인 낭비 원인은 다음과 같습니다:
- 동일한 파일 내용이 반복적으로 전송됨
- 장황한 셸 출력
- 모델이 전체를 필요로 하지 않는 중복 grep 결과
사전 도구 호출 훅은 도구 출력이 Claude에 도달하기 전에 RTK(Redundancy-aware Token Kompression)를 실행합니다. 압축 과정은 다음과 같습니다:
- 반복되는 범위를 중복 제거
- 잡음 제거
- 대규모 읽기 요약
- 압축된 버전을 모델에 반환
성능 결과
훅은 약 2.93ms 내에 실행되어 작업에 지각 가능한 지연 시간을 추가하지 않습니다. 실제로 사용자는 일반적인 코딩 세션에서 입력 토큰이 40-66% 감소하는 것을 확인합니다. 압축이 중복성을 제거하면서 신호를 보존하기 때문에 모델 출력 품질은 변하지 않습니다.
이러한 유형의 최적화는 Claude Code를 광범위하게 사용하는 개발자에게 특히 유용합니다. 반복적인 파일 읽기와 도구 출력은 토큰 사용량과 비용을 크게 증가시킬 수 있기 때문입니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

조라: 기본 거부 보안과 로컬 메모리를 갖춘 오프라인 우선 AI 에이전트
Zora는 기본적으로 Ollama를 통해 완전히 오프라인으로 실행되며, 제로 접근 권한으로 시작하고 세션 간 지속적인 메모리를 유지하는 AI 에이전트입니다. 다른 에이전트에서 나타난 보안 및 비용 문제를 해결합니다.

클로드 코드 루틴: AI 개발 워크플로우를 위한 자동화된 클라우드 작업
Claude Code 루틴은 개발자가 Claude Code 구성을 Anthropic이 관리하는 클라우드 인프라에서 실행되는 자동화된 작업으로 저장할 수 있게 합니다. 루틴은 저장소에 대한 프롬프트의 무인 실행을 위해 예약, API, GitHub 트리거를 지원합니다.

포켓봇: AI가 비용 효율적이고 결정론적인 스케줄링을 위해 자동화를 JavaScript로 컴파일합니다
PocketBot은 자연어 요청을 자체 포함된 자바스크립트 스크립트로 컴파일하여 런타임에 LLM 호출 없이 스케줄에 따라 실행함으로써 API 및 하드웨어 비용 문제를 해결합니다. 이 도구는 코드 작성에만 AI를 한 번 사용한 후 Google Suite, Slack, Notion을 포함한 20개 이상의 통합과 함께 결정론적으로 실행됩니다.

OpenClaw: 지속적인 감시로 웹사이트 유지 관리를 혁신하다
혁신적인 AI 기반 에이전시인 OpenClaw는 끊임없이 24시간 가동하여 웹사이트 유지 관리를 재정의합니다. 고급 자동화를 활용하여 최적의 웹사이트 기능을 보장하고 문제를 신속하게 해결합니다.