Código aberto local alterna automaticamente entre modelos Claude para reduzir custos de IA

✍️ OpenClawRadar📅 Publicado: March 7, 2026🔗 Source
Código aberto local alterna automaticamente entre modelos Claude para reduzir custos de IA
Ad

Um desenvolvedor disponibilizou como código aberto um hook local que seleciona automaticamente o modelo Claude AI mais econômico com base no tipo de tarefa de programação, potencialmente reduzindo os custos de IA em 50-70% sem perda de qualidade.

Como funciona

A ferramenta funciona como um hook local no Cursor e Claude Code (ambos usam o mesmo sistema de hooks) antes de cada prompt ser enviado. Ela fica ao lado do Opus/plano e atua como um filtro de front-end eficiente que evita correspondências de modelo obviamente ruins antes que atinjam modelos caros.

Funcionalidades principais

  • Lê o prompt e a seleção atual do modelo
  • Usa regras simples de palavras-chave para classificar tarefas (operações git, trabalho de funcionalidades, arquitetura/análise profunda)
  • Bloqueia se você está pagando demais (ex: Opus para commit git) e sugere Haiku ou Sonnet
  • Bloqueia se você está com poder insuficiente (Sonnet/Haiku para arquitetura) e sugere Opus
  • Deixa todo o resto passar inalterado
  • O prefixo ! ignora completamente o filtro se você discordar de sua sugestão
Ad

Detalhes técnicos

  • 3 arquivos: bash + python3 + JSON
  • Sem proxy, sem chamadas de API, sem serviços externos
  • Design fail-open: se travar, o Claude Code prossegue normalmente
  • Código aberto em: https://github.com/coyvalyss1/model-matchmaker

Desempenho e testes

O desenvolvedor analisou várias semanas de seus próprios prompts e descobriu:

  • 60-70% eram trabalhos de funcionalidades padrão que o Sonnet poderia lidar
  • 5-20% eram depuração/solução de problemas
  • Uma parte significativa eram tarefas puras de git/renomear/formatação que o Haiku lida de forma idêntica com 90% menos custo

A análise retrospectiva mostrou que a ferramenta teria cortado 50-70% dos gastos com IA sem queda na qualidade. Após ajustes, ela lidou corretamente com 12/12 prompts de teste reais.

Problema que resolve

A questão não é conhecimento — os desenvolvedores sabem que deveriam trocar de modelos — mas atrito. Quando em estado de fluxo, os desenvolvedores não querem pensar em menus suspensos. Esta ferramenta automatiza o processo de tomada de decisão.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

iai-mcp: Daemon local oferece ao Claude memória persistente entre sessões com 99% de recall
Tools

iai-mcp: Daemon local oferece ao Claude memória persistente entre sessões com 99% de recall

iai-mcp é um daemon local de código aberto que captura cada conversa do Claude, organiza em três níveis de memória e fornece contexto de volta em novas sessões. Obtém recall verbatim >99%, recuperação em menos de 100ms e custo de início de sessão inferior a 3.000 tokens.

OpenClawRadar
Maestro v1.5.0 adiciona suporte ao Claude Code para orquestração multiagente.
Tools

Maestro v1.5.0 adiciona suporte ao Claude Code para orquestração multiagente.

Maestro v1.5.0, uma plataforma de orquestração multiagente de código aberto, agora funciona como um plugin nativo no Claude Code, além do Gemini CLI. A atualização inclui planejamento de design mais aprofundado, uma estrutura de orquestração de 42 etapas, reforço de capacidades dos agentes e endurecimento de segurança.

OpenClawRadar
ForgeAI: Uma Bancada Visual para Engenharia de Modelos
Tools

ForgeAI: Uma Bancada Visual para Engenharia de Modelos

O ForgeAI oferece uma interface visual para inspeção, fusão e treinamento de modelos, com recursos como inspeção de arquitetura de modelos 3D e M-DNA Forge para fusão visual de camadas.

OpenClawRadar
civStation: Um Sistema VLM para Jogar Civilization VI por Comandos de Linguagem Natural
Tools

civStation: Um Sistema VLM para Jogar Civilization VI por Comandos de Linguagem Natural

civStation é um sistema VLM de uso computacional que joga Civilization VI traduzindo comandos de linguagem natural de alto nível em ações dentro do jogo. O sistema utiliza uma arquitetura de 3 camadas que separa estratégia e execução, com suporte para intervenção humana em tempo real.

OpenClawRadar