Sistema Multiagente de Haicai Iguala Claude Opus em Problema de Teoria dos Números Complexos com Custo 15x Menor

Configuração Experimental e Resultados
Um usuário do Reddit conduziu um teste comparativo entre duas configurações do modelo Claude em um problema desafiador de teoria dos números. O problema exigia provar que, para um número primo ímpar p, a soma 1^(p-1) + 2^(p-1) + ... + (p-1)^(p-1) é congruente a -1 (mod p), usando o Pequeno Teorema de Fermat e propriedades de raízes primitivas.
Duas configurações foram testadas:
- Configuração X (Opus solo): Claude Opus 4.5 com max_tokens: 2048, sem auditor
- Configuração Y (multiagente Haiku): Gerador Haiku produz a prova completa, segundo auditor Haiku verifica cada etapa, com duas passagens se o auditor sinalizar algo, max_tokens: 1024 por chamada
Pontuação e Desempenho
Ambas as configurações marcaram 4/4 usando esta rubrica:
- Invoca corretamente o Pequeno Teorema de Fermat
- Lida corretamente com o argumento de raiz primitiva
- Soma sobre o sistema completo de resíduos válida
- Conclusão de congruência segue corretamente
O auditor Haiku retornou VERIFICADO sem discordância. Métricas de desempenho:
- Opus solo: ~8,7 segundos, pontuação 4/4
- Haiku + auditor: ~10,9 segundos, pontuação 4/4
Análise de Custo
As implicações econômicas são significativas:
- Opus solo: US$ 0,075/1000 tokens × ~800 tokens = ~US$ 0,06 por consulta
- Haiku + Haiku: US$ 0,0025/1000 tokens × ~1600 tokens = ~US$ 0,004 por consulta
Isso representa aproximadamente 15 vezes menor custo para resultados idênticos neste problema. O problema foi descrito como "genuinamente difícil" e não óbvio nos dados de treinamento como provas mais simples.
A fonte observa que em problemas limpos onde o Pequeno Teorema de Fermat faz o trabalho pesado (cada a^(p-1) ≡ 1, soma (p-1) uns, obtém p-1 ≡ -1), o padrão de auditor adiciona cerca de 17% de tempo extra para confirmar a correção. O padrão é particularmente valioso para problemas onde o gerador pode tropeçar com gagueira de quantização ou álgebra alucinada.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

SDK do Claude Code engenharia reversa lançado em quatro idiomas
Um desenvolvedor engenhou reversamente o Claude Code e criou SDKs de arquivo único em Node.js, Python, Go e Rust sem dependências. As ferramentas fornecem um ciclo completo de agente com streaming e uso de ferramentas, utilizando assinaturas existentes do Claude Pro/Max.

ClawNet: Rede de Agentes de IA Ponto a Ponto Sem Chaves de API
ClawNet é uma rede peer-to-peer que permite que agentes de IA colaborem diretamente sem chaves de API ou taxas de plataforma. A instalação é feita via script curl, e os recursos incluem um bazar de tarefas, economia de shell e rede de conhecimento.

Relay: Uma Ferramenta para Transferir Sessões de Código do Claude para Outros Agentes de IA
Relay é um binário Rust que extrai o contexto da sessão do Claude Code — incluindo histórico de conversas, chamadas de ferramentas, erros e estado do git — e o transfere para outros agentes de IA como Codex ou Gemini quando os limites de taxa são atingidos. Ele suporta 8 agentes e pode ser instalado via GitHub ou npm.

Plugin Peek para Claude Code: Navegação Automática pela Memória da Sessão
Peek é um plugin do Claude Code que captura e injeta automaticamente correções e preferências dos usuários para direcionar o assistente de IA. Ele usa busca por fusão com embeddings, BM25, decaimento temporal e filtros de metadados para fornecer contexto relevante sem solicitação manual.