Fluxo Híbrido de Codificação com IA: Claude + Modelos Locais

Fluxo de trabalho híbrido de IA para codificação reduz custos na nuvem

Um desenvolvedor no r/LocalLLaMA compartilhou um fluxo de trabalho detalhado que combina modelos de IA na nuvem e locais para reduzir custos de tokens mantendo a qualidade da codificação. A abordagem aborda a percepção de que muitas tarefas de codificação não exigem modelos caros na nuvem.

A arquitetura do fluxo de trabalho

O sistema segue a lógica "Raciocine na nuvem, Execute localmente":

Planejador (Claude 3.5 Sonnet): Recebe a tarefa e gera um arquivo task_context.md preciso contendo instruções, caminhos de arquivos e lógica. Isso custa aproximadamente 300-500 tokens.
Codificador (Qwen2.5-Coder 30B local via Ollama): Recebe a especificação e o conteúdo real do arquivo para escrever o código. Isso é executado localmente sem custo.
Validador: Um script Bash simples executa tsc --noEmit ou mypy para verificação de tipos.
Revisor (Qwen2.5-Coder 7B local): Executa em paralelo para verificar falhas lógicas óbvias.
Correção automática: Se a compilação falhar, o log de erro retorna ao codificador local para 2-3 iterações.

Detalhes de implementação

Todo o pipeline é encapsulado em um conjunto de scripts Bash usando apenas jq e curl para comunicação com a API do Ollama. O sistema detecta automaticamente padrões de linguagem (TypeScript, Python, C++, etc.) com base na saída do planejador e não requer ambientes pesados de Python/Node.

O desenvolvedor observa que modelos locais (mesmo os de 30B) frequentemente falham em raciocínio arquitetural complexo, mas são surpreendentemente bons em execução quando recebem especificações extremamente claras.

Resultados e economia

Em um projeto TypeScript recente envolvendo 12 arquivos alterados:

O uso do Claude foi limitado apenas à fase inicial de planejamento
Os modelos locais lidaram com todo o resto: escrita de 12 arquivos, linting e revisão
Economia total: aproximadamente 85% de redução de tokens em comparação com fazer tudo dentro do Claude Code CLI

O desenvolvedor disponibilizou os scripts em um repositório chamado ai-orchestrator no GitHub (nome de usuário: Mybono) para quem se interessar pelos detalhes de implementação.

📖 Read the full source: r/LocalLLaMA