Dirac: Agente Open-Source Alcança 65,2% no TerminalBench, Mais Barato e Aberto

✍️ OpenClawRadar📅 Publicado: April 27, 2026🔗 Source
Dirac: Agente Open-Source Alcança 65,2% no TerminalBench, Mais Barato e Aberto
Ad

Dirac é um agente de codificação de código aberto que acaba de liderar o ranking do TerminalBench 2.0 para gemini-3-flash-preview com uma pontuação de 65,2% — superando a linha de base oficial do Google de 47,6% e o anterior principal agente de código fechado Junie CLI com 64,3%. A execução foi totalmente de código aberto, sem arquivos AGENTS.md específicos do benchmark ou outros mecanismos de trapaça. O mantenedor enviou um PR ao ranking há 8 dias, mas não recebeu resposta devido ao acúmulo de solicitações.

Principais Recursos

  • Edições paralelas ancoradas por hash para alterações de código eficientes e precisas.
  • Manipulação de AST para compreender e transformar código estruturalmente.
  • Curadoria de contexto para manter o contexto bem focado, melhorando a precisão e reduzindo custos — afirma redução média de 64,8% nos custos em relação a outros agentes.
  • Sem MCP (Model Context Protocol) — ferramentas diretas.
Ad

Resultados TerminalBench 2.0

Pontuação no gemini-3-flash-preview: 65,2% contra 47,6% do Google e 64,3% do Junie CLI. A execução foi feita em conformidade com o ranking (sem modificações de recursos ou tempo limite). Todo o código está no GitHub — não há diferença entre o que foi executado e o que é público.

Comparação de Custos

O custo médio por tarefa do Dirac em 8 benchmarks (contra Cline, Kilo, Ohmypi, Opencode, Pimono, Roo) foi de $0,18, contra o segundo melhor com $0,38. Isso representa uma redução de 64,8%, ou 2,8x mais barato. Por exemplo, Tarefa1 (transformers, 8 arquivos) custou $0,13 contra $0,37 do Cline. Tarefa6 (transformers, 25 arquivos) custou $0,34 contra $0,94 do Ohmypi.

Instalação e Uso

Clone o repositório e siga as instruções de configuração no README.md. O agente funciona como uma ferramenta de linha de comando. Nenhuma configuração especial além de Node.js e chaves de API para o modelo escolhido.

📖 Leia a fonte completa: HN AI Agents

Ad

👀 See Also

devopsiphai: Habilidade de código Claude de código aberto audita a saúde operacional em 6 fases
Tools

devopsiphai: Habilidade de código Claude de código aberto audita a saúde operacional em 6 fases

devopsiphai é uma habilidade de código Claude de código aberto que audita a operacionalidade de projetos de produção usando um processo de 6 fases e a estrutura ARC, gerando notas em letras e um TODO.md estruturado com tarefas estimadas por esforço.

OpenClawRadar
Pu.sh: Um Harness de Agente de Codificação com 400 Linhas de Script Shell do HN
Tools

Pu.sh: Um Harness de Agente de Codificação com 400 Linhas de Script Shell do HN

Pu.sh é um harness portátil para agentes de codificação em 400 linhas de shell (sh, curl, awk), suportando Anthropic + OpenAI, 7 ferramentas, REPL, checkpoint/resume e modo pipe — com 90 testes sem API.

OpenClawRadar
Extrator Lightfeed: Biblioteca TypeScript para Extração Robusta de Dados da Web com LLMs
Tools

Extrator Lightfeed: Biblioteca TypeScript para Extração Robusta de Dados da Web com LLMs

Lightfeed Extractor é uma biblioteca TypeScript que gerencia todo o pipeline, desde HTML bruto até dados estruturados validados usando LLMs, com recursos como conversão de HTML para markdown, validação de esquema Zod, recuperação de JSON e automação de navegador Playwright integrada.

OpenClawRadar
Localização Automatizada de .xcstrings com Claude Code
Tools

Localização Automatizada de .xcstrings com Claude Code

Uma nova habilidade do Claude Code automatiza a localização de arquivos .xcstrings do Xcode com cinco estágios de pipeline: varredura de domínio, geração de comentários, tradução com plurais CLDR, verificação gramatical e conversão de plurais.

OpenClawRadar