El complemento MCP de caché de prompts reduce automáticamente los costos de la API de Claude al identificar contextos estables.

Prompt-caching es un complemento MCP que reduce automáticamente los costos de la API de Claude aprovechando la función de caché de Anthropic. Al usar Claude Code o Cursor/Windsurf/Zed con la API de Anthropic, cada turno normalmente reenvía todo el contexto desde cero, lo que significa que miles de tokens se facturan a tarifa completa repetidamente durante largas sesiones de depuración.
Cómo funciona
Anthropic proporciona una función de caché que hace que las lecturas repetidas cuesten 0.1× en lugar de 1×, pero esto requiere marcar manualmente lo que se almacena en caché. El complemento prompt-caching se ejecuta en segundo plano, identifica partes estables de tu contexto (prompts del sistema, definiciones de herramientas, lecturas de archivos grandes) y las marca automáticamente antes de cada llamada a la API.
Resultados de rendimiento
- Corrección de error de 20 turnos: 85% más económico
- Refactorización de 15 turnos: 80% más económico
- Sesión de codificación de 40 turnos: 92% más económico
Instalación
Para usuarios de Claude Code:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis
Para Cursor/Windsurf/Zed:
npm install -g prompt-caching-mcp
Luego apunta tu configuración MCP hacia él.
La herramienta es de código abierto bajo la licencia MIT y está disponible de forma gratuita. El repositorio está en https://github.com/flightlesstux/prompt-caching.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Claude-Code v2.1.63 agrega enlaces HTTP, comandos de barra y corrige fugas de memoria.
Claude-Code v2.1.63 introduce ganchos HTTP para llamadas externas basadas en JSON, añade los comandos de barra /simplify y /batch, y corrige múltiples fugas de memoria en sesiones de larga duración. La versión también mejora el manejo de servidores MCP y la integración con VSCode.

obsidian-mcp: Servidor MCP consciente del grafo para Claude con 25 herramientas orientadas a bóvedas grandes
obsidian-mcp es un servidor MCP que expone 25 herramientas (incluyendo get_note, traverse_graph, query_dataview, move_note, create_notes) que le da a Claude acceso consciente del grafo a tu bóveda de Obsidian, evitando la muerte del contexto en bóvedas de 5000 notas. MIT, funciona con Claude Desktop, Claude Code, Cursor, Cline, Continue, Zed.

Widget de hardware y extensión de Chrome monitorean los límites de tasa de la API de Claude.
Un desarrollador construyó un dispositivo de hardware usando ESP8266 y una pantalla OLED que rastrea los límites de tasa de Claude en tiempo real, más una extensión de Chrome que intercepta la API interna /usage de Claude y muestra patrones de uso. El costo total de la lista de materiales es aproximadamente $6.50.

Routerly: Puerta de Enlace LLM Autohospedada con Políticas de Enrutamiento en Tiempo de Ejecución y Control de Presupuesto
Routerly es una puerta de enlace LLM gratuita, de código abierto y autoalojada que proporciona selección de modelos en tiempo de ejecución basada en políticas de enrutamiento como el más barato, el más rápido o el más capaz, junto con límites de presupuesto a nivel de proyecto con seguimiento por token. Es compatible con OpenAI para un uso directo con herramientas como Cursor, LangChain y Open WebUI.