Código aberto local alterna automaticamente entre modelos Claude para reduzir custos de IA

Um desenvolvedor disponibilizou como código aberto um hook local que seleciona automaticamente o modelo Claude AI mais econômico com base no tipo de tarefa de programação, potencialmente reduzindo os custos de IA em 50-70% sem perda de qualidade.
Como funciona
A ferramenta funciona como um hook local no Cursor e Claude Code (ambos usam o mesmo sistema de hooks) antes de cada prompt ser enviado. Ela fica ao lado do Opus/plano e atua como um filtro de front-end eficiente que evita correspondências de modelo obviamente ruins antes que atinjam modelos caros.
Funcionalidades principais
- Lê o prompt e a seleção atual do modelo
- Usa regras simples de palavras-chave para classificar tarefas (operações git, trabalho de funcionalidades, arquitetura/análise profunda)
- Bloqueia se você está pagando demais (ex: Opus para commit git) e sugere Haiku ou Sonnet
- Bloqueia se você está com poder insuficiente (Sonnet/Haiku para arquitetura) e sugere Opus
- Deixa todo o resto passar inalterado
- O prefixo ! ignora completamente o filtro se você discordar de sua sugestão
Detalhes técnicos
- 3 arquivos: bash + python3 + JSON
- Sem proxy, sem chamadas de API, sem serviços externos
- Design fail-open: se travar, o Claude Code prossegue normalmente
- Código aberto em: https://github.com/coyvalyss1/model-matchmaker
Desempenho e testes
O desenvolvedor analisou várias semanas de seus próprios prompts e descobriu:
- 60-70% eram trabalhos de funcionalidades padrão que o Sonnet poderia lidar
- 5-20% eram depuração/solução de problemas
- Uma parte significativa eram tarefas puras de git/renomear/formatação que o Haiku lida de forma idêntica com 90% menos custo
A análise retrospectiva mostrou que a ferramenta teria cortado 50-70% dos gastos com IA sem queda na qualidade. Após ajustes, ela lidou corretamente com 12/12 prompts de teste reais.
Problema que resolve
A questão não é conhecimento — os desenvolvedores sabem que deveriam trocar de modelos — mas atrito. Quando em estado de fluxo, os desenvolvedores não querem pensar em menus suspensos. Esta ferramenta automatiza o processo de tomada de decisão.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

iai-mcp: Daemon local oferece ao Claude memória persistente entre sessões com 99% de recall
iai-mcp é um daemon local de código aberto que captura cada conversa do Claude, organiza em três níveis de memória e fornece contexto de volta em novas sessões. Obtém recall verbatim >99%, recuperação em menos de 100ms e custo de início de sessão inferior a 3.000 tokens.

Maestro v1.5.0 adiciona suporte ao Claude Code para orquestração multiagente.
Maestro v1.5.0, uma plataforma de orquestração multiagente de código aberto, agora funciona como um plugin nativo no Claude Code, além do Gemini CLI. A atualização inclui planejamento de design mais aprofundado, uma estrutura de orquestração de 42 etapas, reforço de capacidades dos agentes e endurecimento de segurança.

ForgeAI: Uma Bancada Visual para Engenharia de Modelos
O ForgeAI oferece uma interface visual para inspeção, fusão e treinamento de modelos, com recursos como inspeção de arquitetura de modelos 3D e M-DNA Forge para fusão visual de camadas.

civStation: Um Sistema VLM para Jogar Civilization VI por Comandos de Linguagem Natural
civStation é um sistema VLM de uso computacional que joga Civilization VI traduzindo comandos de linguagem natural de alto nível em ações dentro do jogo. O sistema utiliza uma arquitetura de 3 camadas que separa estratégia e execução, com suporte para intervenção humana em tempo real.