Prefex: 로컬 프록시로 Claude Code 프롬프트 캐싱 자동화

Prefex는 Claude Code 사용 시 API 비용을 절감하기 위해 설계된 로컬 프록시 도구입니다. 이 도구는 두 가지 특정한 비효율성을 해결합니다: Anthropic의 베타 프롬프트 캐싱 기능은 수동 헤더 주입이 필요하며, Claude Code는 모든 요청에 전체 대화 기록을 전송합니다.

작동 방식

Prefex는 Claude Code와 Anthropic API 사이의 프록시로 사용자의 로컬 머신에서 완전히 실행됩니다. 이 도구는 Anthropic의 프롬프트 캐싱 기능을 활성화하는 데 필요한 특정 헤더를 자동으로 주입하여 반복 입력 토큰에 대한 비용을 90% 절감합니다. 이 헤더가 없으면 CLAUDE.md 및 프로젝트 컨텍스트를 포함한 모든 요청이 정가로 청구됩니다.

이 도구는 또한 세션 메모리를 구현하여 Claude Code가 각 차례마다 전체 대화 기록을 재전송하는 것을 방지합니다. 추가로 더 저렴한 모델로 간단한 쿼리를 라우팅할 수 있는 모델 라우터를 포함하지만, 이 기능은 초기 테스트 기간 동안 활성화되지 않았습니다.