Dirac: Агент с открытым исходным кодом лидирует в TerminalBench с результатом 65.2%, дешевле и открыт

Dirac — это агент для программирования с открытым исходным кодом, который только что возглавил таблицу лидеров TerminalBench 2.0 для gemini-3-flash-preview с результатом 65,2%, превзойдя официальный базовый показатель Google в 47,6% и предыдущего лучшего закрытого агента Junie CLI с 64,3%. Запуск был полностью открытым, без использования файлов AGENTS.md, специфичных для бенчмарка, или других механизмов мошенничества. Мейнтейнер отправил PR в таблицу лидеров 8 дней назад, но не получил ответа из-за загруженности.
Ключевые особенности
- Хэш-привязанные параллельные правки для эффективных и точных изменений кода.
- Манипуляции с AST для понимания и структурного преобразования кода.
- Курирование контекста для поддержания плотной фокусировки контекста, повышения точности и снижения затрат — утверждается, что среднее снижение затрат на 64,8% по сравнению с другими агентами.
- Без MCP (Model Context Protocol) — простой инструментарий.
Результаты TerminalBench 2.0
Оценка на gemini-3-flash-preview: 65,2% против 47,6% у Google и 64,3% у Junie CLI. Запуск был выполнен в соответствии с правилами таблицы лидеров (без изменений ресурсов или тайм-аутов). Весь код на GitHub — нет различий между тем, что было запущено, и тем, что публично доступно.
Сравнение затрат
Средняя стоимость задачи для Dirac по 8 бенчмаркам (против Cline, Kilo, Ohmypi, Opencode, Pimono, Roo) составила $0,18 против следующего лучшего результата в $0,38. Это снижение на 64,8% или в 2,8 раза дешевле. Например, Task1 (transformers, 8 файлов) стоила $0,13 против $0,37 у Cline. Task6 (transformers, 25 файлов) стоила $0,34 против $0,94 у Ohmypi.
Установка и использование
Клонируйте репозиторий и следуйте инструкциям по установке в README.md. Агент запускается как CLI-инструмент. Никакой специальной настройки, кроме Node.js и ключей API для выбранной модели.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

OpenMind добавляет визуальный интерфейс ментальных карт к установкам OpenClaw.
OpenMind — это инструмент с открытым исходным кодом, который преобразует установки OpenClaw в интерактивные, редактируемые в реальном времени ментальные карты с визуализацией памяти, горячей заменой логики и полнотекстовым поиском по всем узлам.

mcp-india-stack: Открытый MCP-сервер для индийских финансовых API
mcp-india-stack — это сервер MCP с открытым исходным кодом, который предоставляет Claude нативный доступ к семи индийским финансовым и государственным API-инструментам, включая проверку GSTIN, поиск IFSC и проверку PAN. Он не требует аутентификации, работает в первую очередь офлайн и доступен через pip install.

Расширение для браузера "Claude Usage Bar Colorizer", созданное с помощью Claude Code
Разработчик создал расширение для браузера, которое перекрашивает индикаторы использования Claude из зелёного в жёлтый и красный в зависимости от процентных порогов, добавляет всплывающее окно с данными об использовании в реальном времени и позволяет настраивать пороги и цвета. Расширение работает только на странице использования Claude, сохраняет настройки локально и не отправляет сетевые запросы.

Skynet: Сеть МногоАгентного Взаимодействия для Кодовых Агентов Claude
Skynet — это открытая сеть, которая обеспечивает ролевое взаимодействие между несколькими агентами Claude Code и людьми. Она устанавливается как навык с помощью npx и управляется через естественно-языковые команды.