Sistema Multiagente Haicai 15x Mais Barato que Claude Opus

Configuração Experimental e Resultados

Um usuário do Reddit conduziu um teste comparativo entre duas configurações do modelo Claude em um problema desafiador de teoria dos números. O problema exigia provar que, para um número primo ímpar p, a soma 1^(p-1) + 2^(p-1) + ... + (p-1)^(p-1) é congruente a -1 (mod p), usando o Pequeno Teorema de Fermat e propriedades de raízes primitivas.

Duas configurações foram testadas:

Configuração X (Opus solo): Claude Opus 4.5 com max_tokens: 2048, sem auditor
Configuração Y (multiagente Haiku): Gerador Haiku produz a prova completa, segundo auditor Haiku verifica cada etapa, com duas passagens se o auditor sinalizar algo, max_tokens: 1024 por chamada

Pontuação e Desempenho

Ambas as configurações marcaram 4/4 usando esta rubrica:

Invoca corretamente o Pequeno Teorema de Fermat
Lida corretamente com o argumento de raiz primitiva
Soma sobre o sistema completo de resíduos válida
Conclusão de congruência segue corretamente

O auditor Haiku retornou VERIFICADO sem discordância. Métricas de desempenho:

Opus solo: ~8,7 segundos, pontuação 4/4
Haiku + auditor: ~10,9 segundos, pontuação 4/4

Análise de Custo

As implicações econômicas são significativas:

Opus solo: US$ 0,075/1000 tokens × ~800 tokens = ~US$ 0,06 por consulta
Haiku + Haiku: US$ 0,0025/1000 tokens × ~1600 tokens = ~US$ 0,004 por consulta

Isso representa aproximadamente 15 vezes menor custo para resultados idênticos neste problema. O problema foi descrito como "genuinamente difícil" e não óbvio nos dados de treinamento como provas mais simples.

A fonte observa que em problemas limpos onde o Pequeno Teorema de Fermat faz o trabalho pesado (cada a^(p-1) ≡ 1, soma (p-1) uns, obtém p-1 ≡ -1), o padrão de auditor adiciona cerca de 17% de tempo extra para confirmar a correção. O padrão é particularmente valioso para problemas onde o gerador pode tropeçar com gagueira de quantização ou álgebra alucinada.

📖 Leia a fonte completa: r/ClaudeAI

Sistema Multiagente de Haicai Iguala Claude Opus em Problema de Teoria dos Números Complexos com Custo 15x Menor

Configuração Experimental e Resultados

Pontuação e Desempenho

Análise de Custo

👀 See Also

SDK do Claude Code engenharia reversa lançado em quatro idiomas

ClawNet: Rede de Agentes de IA Ponto a Ponto Sem Chaves de API

Relay: Uma Ferramenta para Transferir Sessões de Código do Claude para Outros Agentes de IA

Plugin Peek para Claude Code: Navegação Automática pela Memória da Sessão