Dirac: Agente de código abierto lidera TerminalBench con un 65.2%, más barato y abierto

✍️ OpenClawRadar📅 Publicado: 27 de abril de 2026🔗 Source
Dirac: Agente de código abierto lidera TerminalBench con un 65.2%, más barato y abierto
Ad

Dirac es un agente de codificación de código abierto que acaba de encabezar la clasificación de TerminalBench 2.0 para gemini-3-flash-preview con una puntuación del 65,2%, superando la línea base oficial de Google del 47,6% y el anterior mejor agente de código cerrado Junie CLI con un 64,3%. La ejecución se realizó completamente con código abierto, sin archivos AGENTS.md específicos del benchmark ni otros mecanismos de trampa. El mantenedor envió un PR a la clasificación hace 8 días, pero no ha recibido respuesta debido al retraso en la revisión.

Características clave

  • Ediciones paralelas ancladas por hash para cambios de código eficientes y precisos.
  • Manipulación de AST para comprender y transformar el código estructuralmente.
  • Curación de contexto para mantener el contexto ajustado, mejorando la precisión y reduciendo costos: afirma una reducción de costos promedio del 64,8% en comparación con otros agentes.
  • Sin MCP (Model Context Protocol): herramientas sencillas y directas.
Ad

Resultados de TerminalBench 2.0

Puntuación en gemini-3-flash-preview: 65,2% frente al 47,6% de Google y el 64,3% de Junie CLI. La ejecución se realizó de manera compatible con la clasificación (sin modificaciones de recursos ni tiempos de espera). Todo el código está en GitHub; no hay diferencia entre lo ejecutado y lo público.

Comparación de costos

El costo promedio por tarea de Dirac en 8 benchmarks (frente a Cline, Kilo, Ohmypi, Opencode, Pimono, Roo) fue de $0,18, frente al siguiente mejor de $0,38. Esto representa una reducción del 64,8%, o 2,8 veces más barato. Por ejemplo, la Tarea1 (transformers, 8 archivos) costó $0,13 frente a $0,37 de Cline. La Tarea6 (transformers, 25 archivos) costó $0,34 frente a $0,94 de Ohmypi.

Instalación y uso

Clone el repositorio y siga las instrucciones de configuración en el README.md. El agente se ejecuta como una herramienta CLI. No se necesita configuración especial más allá de Node.js y claves de API para el modelo elegido.

📖 Leer la fuente completa: HN AI Agents

Ad

👀 Ver también

Brainstorm MCP Server: Permite que Claude Consulte a Otros LLMs para Obtener Mejores Respuestas
Herramientas

Brainstorm MCP Server: Permite que Claude Consulte a Otros LLMs para Obtener Mejores Respuestas

Un desarrollador construyó un servidor MCP que permite a Claude Code consultar con otros modelos de IA como GPT-5.2 y DeepSeek antes de proporcionar respuestas. Los modelos participan en debates de múltiples rondas donde leen las respuestas de los demás, discrepan y refinan sus posiciones para converger en mejores soluciones.

OpenClawRadar
Automatiza las reuniones diarias en podcasts personales de Spotify con OpenClaw y la CLI de Save to Spotify
Herramientas

Automatiza las reuniones diarias en podcasts personales de Spotify con OpenClaw y la CLI de Save to Spotify

OpenClaw se ejecuta diariamente a las 7 a.m., extrae hilos de Slack + notificaciones de GitHub + calendario, los resume en mp3 y los sube como un episodio privado mediante la CLI Save to Spotify. Funciona en Free y Premium.

OpenClawRadar
Presentamos cltree: una TUI de árbol de archivos para Claude Code.
Herramientas

Presentamos cltree: una TUI de árbol de archivos para Claude Code.

<strong>cltree</strong> es una interfaz de usuario en terminal de panel dividido (TUI) que muestra el árbol de archivos de tu proyecto en tiempo real junto a Claude Code, mostrando el directorio de trabajo actual, ocultando el ruido y permitiendo que todas las pulsaciones de teclas pasen sin interferencias.

OpenClawRadar
Enjambre Abierto: Sistema de Código Abierto para Ejecutar Miles de Agentes de IA en Paralelo
Herramientas

Enjambre Abierto: Sistema de Código Abierto para Ejecutar Miles de Agentes de IA en Paralelo

Open Swarm es un sistema de código abierto que genera miles de agentes de IA paralelos con acceso completo a más de 150 herramientas de internet, incluyendo correo electrónico, redes sociales, Google Workspace, búsqueda web, ejecución de código y programación cron.

OpenClawRadar