Gancho local alterna Claude Haiku, Sonnet, Opus para reducir costos 50-70%

Un desarrollador ha publicado como código abierto un gancho local que selecciona automáticamente el modelo de IA Claude más rentable según el tipo de tarea de programación, reduciendo potencialmente los costos de IA entre un 50-70% sin pérdida de calidad.

Cómo funciona

La herramienta se ejecuta como un gancho local en Cursor y Claude Code (ambos usan el mismo sistema de ganchos) antes de que se envíe cada indicación. Se sitúa junto a Opus/plan y actúa como un filtro front-end eficiente que evita coincidencias de modelos claramente inadecuadas antes de que lleguen a los modelos costosos.

Funcionalidad clave

Lee la indicación y la selección actual del modelo
Utiliza reglas simples de palabras clave para clasificar tareas (operaciones de git, trabajo de características, arquitectura/análisis profundo)
Bloquea si estás pagando de más (por ejemplo, Opus para un commit de git) y sugiere Haiku o Sonnet
Bloquea si te falta potencia (Sonnet/Haiku para arquitectura) y sugiere Opus
Deja pasar todo lo demás sin cambios
El prefijo ! omite el filtro por completo si no estás de acuerdo con su sugerencia

Detalles técnicos

3 archivos: bash + python3 + JSON
Sin proxy, sin llamadas API, sin servicios externos
Diseño de fallo abierto: si se bloquea, Claude Code continúa normalmente
Código abierto en: https://github.com/coyvalyss1/model-matchmaker

Rendimiento y pruebas

El desarrollador analizó varias semanas de sus propias indicaciones y descubrió:

60-70% eran trabajo estándar de características que Sonnet podía manejar
5-20% eran depuración/solución de problemas
Una parte significativa eran tareas puras de git/renombrar/formateo que Haiku maneja de manera idéntica con un 90% menos de costo

El análisis retrospectivo mostró que la herramienta habría reducido entre un 50-70% del gasto en IA sin caída de calidad. Después de ajustarla, manejó correctamente 12/12 indicaciones de prueba reales.

Problema que resuelve

El problema no es el conocimiento—los desarrolladores saben que deberían cambiar de modelo—sino la fricción. Cuando están en estado de flujo, los desarrolladores no quieren pensar en menús desplegables. Esta herramienta automatiza el proceso de toma de decisiones.

📖 Leer la fuente completa: r/ClaudeAI

Código abierto local cambia automáticamente entre modelos de Claude para reducir costos de IA.

Cómo funciona

Funcionalidad clave

Detalles técnicos

Rendimiento y pruebas

Problema que resuelve

👀 Ver también

Desbloqueando la Proactividad: Una Profundización en las Innovaciones de Clawbot de la Comunidad

Claude Code ahora admite más de 240 modelos a través de la puerta de enlace NVIDIA NIM, incluido Nemotron-3 120B para codificación agentiva

Termrender: Visualización de Interfaz ASCII 6x Eficiente en Tokens para Claude

Comparando Sistemas de IA Multiagente: Harness de Anthropic vs. el Modelo de Organización de Ingeniería de Agyn