프롬프트 캐싱 MCP 플러그인은 안정적인 컨텍스트를 식별하여 Claude API 비용을 자동으로 절감합니다.

프롬프트 캐싱은 Anthropic의 캐싱 기능을 활용하여 Claude API 비용을 자동으로 줄이는 MCP 플러그인입니다. Claude Code 또는 Cursor/Windsurf/Zed를 Anthropic API와 함께 사용할 때, 각 턴마다 일반적으로 전체 컨텍스트를 처음부터 다시 전송하므로 긴 디버깅 세션 동안 수천 개의 토큰이 전체 요금으로 반복적으로 청구됩니다.
작동 방식
Anthropic은 반복 읽기 비용을 1× 대신 0.1×로 만드는 캐싱 기능을 제공하지만, 이는 캐시할 대상을 수동으로 표시해야 합니다. 프롬프트 캐싱 플러그인은 백그라운드에서 실행되어 컨텍스트의 안정적인 부분(시스템 프롬프트, 도구 정의, 대용량 파일 읽기)을 식별하고 각 API 호출 전에 자동으로 표시합니다.
성능 결과
- 20턴 버그 수정: 85% 저렴
- 15턴 리팩터링: 80% 저렴
- 40턴 코딩 세션: 92% 저렴
설치
Claude Code 사용자:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis
Cursor/Windsurf/Z드:
npm install -g prompt-caching-mcp
그런 다음 MCP 구성을 해당 위치로 지정하세요.
이 도구는 MIT 라이선스 하에 오픈 소스이며 무료로 사용할 수 있습니다. 저장소는 https://github.com/flightlesstux/prompt-caching에 있습니다.
📖 전체 원문 읽기: r/ClaudeAI
👀 See Also

CK 검색: MCP 서버 통합을 갖춘 로컬 의미론적 검색 도구
CK Search는 클라우드 의존성 없이 텍스트 디렉토리를 인덱싱하는 로컬 시맨틱 검색 도구로, 내장 MCP 서버를 포함하고 있습니다. 이 도구는 MCP를 통해 AI 에이전트가 사용할 수 있으며, 소스는 grep과 비교한 설정, 장점, 한계를 다루는 실용적인 가이드를 제공합니다.

네이티브 macOS MCP 서버로 전체 OS 제어
네이티브 macOS 서버는 픽셀 정밀 클릭, 키 조합, 드래그 앤 드롭, 앱 관리, 다중 디스플레이 지원, 클립보드 접근을 위한 24가지 도구를 제공합니다. 오픈 소스이며 Claude Code, Cursor 또는 모든 MCP 클라이언트와 호환됩니다.

클로드의 캔바 통합: 디자인 생성을 위한 실용적인 워크플로우
Claude의 Canva 커넥터는 단순한 이미지가 아닌 구조화된 레이아웃으로 편집 가능한 Canva 프로젝트를 내보냅니다. 이 게시물은 프롬프트에서 완성된 캐러셀까지 12~15분이 걸리는 워크플로우를 설정, 고충실도 모드, 솔직한 한계를 포함하여 설명합니다.

Graphthulhu MCP 서버는 AI 에이전트에게 Logseq/Obsidian용 지식 그래프 메모리를 제공합니다
Graphthulhu는 AI 에이전트에게 Logseq 또는 Obsidian 볼트에 대한 읽기-쓰기 접근 권한을 제공하는 오픈소스 MCP 서버로, 벡터 임베딩 대신 속성과 링크가 있는 구조화된 페이지로 메모리를 저장합니다. 한 달 후, 시스템은 1,451개의 상호 참조가 있는 404페이지를 생성했습니다.