Dirac: Агент с открытым исходным кодом лидирует в TerminalBench с результатом 65.2%, дешевле и открыт

✍️ OpenClawRadar📅 Опубликовано: 27 апреля 2026 г.🔗 Source
Dirac: Агент с открытым исходным кодом лидирует в TerminalBench с результатом 65.2%, дешевле и открыт
Ad

Dirac — это агент для программирования с открытым исходным кодом, который только что возглавил таблицу лидеров TerminalBench 2.0 для gemini-3-flash-preview с результатом 65,2%, превзойдя официальный базовый показатель Google в 47,6% и предыдущего лучшего закрытого агента Junie CLI с 64,3%. Запуск был полностью открытым, без использования файлов AGENTS.md, специфичных для бенчмарка, или других механизмов мошенничества. Мейнтейнер отправил PR в таблицу лидеров 8 дней назад, но не получил ответа из-за загруженности.

Ключевые особенности

  • Хэш-привязанные параллельные правки для эффективных и точных изменений кода.
  • Манипуляции с AST для понимания и структурного преобразования кода.
  • Курирование контекста для поддержания плотной фокусировки контекста, повышения точности и снижения затрат — утверждается, что среднее снижение затрат на 64,8% по сравнению с другими агентами.
  • Без MCP (Model Context Protocol) — простой инструментарий.
Ad

Результаты TerminalBench 2.0

Оценка на gemini-3-flash-preview: 65,2% против 47,6% у Google и 64,3% у Junie CLI. Запуск был выполнен в соответствии с правилами таблицы лидеров (без изменений ресурсов или тайм-аутов). Весь код на GitHub — нет различий между тем, что было запущено, и тем, что публично доступно.

Сравнение затрат

Средняя стоимость задачи для Dirac по 8 бенчмаркам (против Cline, Kilo, Ohmypi, Opencode, Pimono, Roo) составила $0,18 против следующего лучшего результата в $0,38. Это снижение на 64,8% или в 2,8 раза дешевле. Например, Task1 (transformers, 8 файлов) стоила $0,13 против $0,37 у Cline. Task6 (transformers, 25 файлов) стоила $0,34 против $0,94 у Ohmypi.

Установка и использование

Клонируйте репозиторий и следуйте инструкциям по установке в README.md. Агент запускается как CLI-инструмент. Никакой специальной настройки, кроме Node.js и ключей API для выбранной модели.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

OpenMind добавляет визуальный интерфейс ментальных карт к установкам OpenClaw.
Инструменты

OpenMind добавляет визуальный интерфейс ментальных карт к установкам OpenClaw.

OpenMind — это инструмент с открытым исходным кодом, который преобразует установки OpenClaw в интерактивные, редактируемые в реальном времени ментальные карты с визуализацией памяти, горячей заменой логики и полнотекстовым поиском по всем узлам.

OpenClawRadar
mcp-india-stack: Открытый MCP-сервер для индийских финансовых API
Инструменты

mcp-india-stack: Открытый MCP-сервер для индийских финансовых API

mcp-india-stack — это сервер MCP с открытым исходным кодом, который предоставляет Claude нативный доступ к семи индийским финансовым и государственным API-инструментам, включая проверку GSTIN, поиск IFSC и проверку PAN. Он не требует аутентификации, работает в первую очередь офлайн и доступен через pip install.

OpenClawRadar
Расширение для браузера "Claude Usage Bar Colorizer", созданное с помощью Claude Code
Инструменты

Расширение для браузера "Claude Usage Bar Colorizer", созданное с помощью Claude Code

Разработчик создал расширение для браузера, которое перекрашивает индикаторы использования Claude из зелёного в жёлтый и красный в зависимости от процентных порогов, добавляет всплывающее окно с данными об использовании в реальном времени и позволяет настраивать пороги и цвета. Расширение работает только на странице использования Claude, сохраняет настройки локально и не отправляет сетевые запросы.

OpenClawRadar
Skynet: Сеть МногоАгентного Взаимодействия для Кодовых Агентов Claude
Инструменты

Skynet: Сеть МногоАгентного Взаимодействия для Кодовых Агентов Claude

Skynet — это открытая сеть, которая обеспечивает ролевое взаимодействие между несколькими агентами Claude Code и людьми. Она устанавливается как навык с помощью npx и управляется через естественно-языковые команды.

OpenClawRadar