AGENTS.md Правильно: Повышение точности на 25% — или падение на 30%

Augment Code провела систематическое исследование файлов AGENTS.md в своем монорепозитории. Лучшие файлы обеспечили скачок качества работы агента, эквивалентный переходу от Haiku к Opus; худшие сделали результат хуже, чем полное отсутствие AGENTS.md. Один и тот же файл повысил показатель best_practices на 25% при обычном исправлении ошибки и снизил completeness на 30% при сложной задаче по реализации функции в том же модуле. Вот что работает.
Как они измеряли
Они использовали AuggieBench — внутренний набор для оценки. Начали с качественных PR из большого репозитория, отражающих типичные ежедневные задачи агента, настроили окружение и промпт, и попросили агента воспроизвести PR. Результат сравнивали с эталонным PR (версия, утвержденная после рецензирования несколькими старшими инженерами). PR должны были быть ограничены одним модулем или приложением, а область — такой, где AGENTS.md мог бы быть полезен. Каждая задача запускалась дважды — с файлом и без.
Что работает
1. Прогрессивное раскрытие информации > Всеобъемлющее покрытие
Описывайте общие случаи и рабочие процессы на высоком уровне; детали выносите в справочные файлы, которые агент может загружать по требованию. Четко обозначайте область каждого справочного файла. Файлы объемом 100–150 строк с несколькими сфокусированными справочными документами обеспечили улучшение на 10–15% по всем метрикам в модулях среднего размера (~100 основных файлов). При большем объеме улучшения сходили на нет.
2. Процедурные рабочие процессы
Нумерованный многошаговый рабочий процесс может перевести агента из состояния неудачи к успешному завершению. Пример: шестишаговый процесс развертывания новой интеграции. Количество файлов с отсутствующими связями снизилось с 40% до 10%, агент завершал работу быстрее, правильность возросла на 25%, полнота — на 20%. Держите основной файл кратким, а для разветвлений используйте справочные файлы.
3. Таблицы решений
Когда есть два или три разумных подхода (например, React Query против Zustand для управления состоянием), принудительно выбирайте на старте с помощью таблицы. Пример:
Вопрос → React Query → Zustand
Сервер — единственный источник данных? ✅
Несколько путей кода изменяют это состояние? ✅
Нужны оптимистичные обновления в сочетании с локальным состоянием? ✅
PR в этой области показали на 25% более высокий балл по best_practices.
4. Короткие примеры из продакшна
Фрагменты кода длиной 3–10 строк из реального продакшн-кода улучшили повторное использование и соблюдение шаблонов. Пример: шаблоны для копирования примитивов Redux Toolkit (createSlice с типизированным начальным состоянием, createAsyncThunk с обработкой ошибок, типизированный useAppSelector). Показатель code_reuse вырос на 20%.
5. Доменно-специфичные правила
По-прежнему важны — это тот шаблон, который большинство уже ассоциирует с AGENTS.md.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Компоненты кодирующего агента: как инструменты, память и контекст расширяют возможности больших языковых моделей
Себастьян Рашка разбирает шесть строительных блоков кодирующих агентов, таких как Claude Code и Codex CLI, объясняя, как агентные оболочки объединяют модели с инструментами, памятью и контекстом репозитория, чтобы сделать большие языковые модели более эффективными для работы с программным обеспечением.

Владельцы репозиториев GitHub: используйте флаг --author в Git для блокировки спама от ИИ-ботов
Archestra боролась с AI-спамом в комментариях и PR, используя настройку GitHub «Limit to prior contributors» и флаг Git --author для включения реальных людей в белый список через капчу.

Интерактивные объяснительные карты: проектирование циклов агентов Claude Code от одиночных вызовов до самомутирующих промптов
Интерактивный сайт, созданный с помощью Opus 4.7, визуализирует 11 реальных дизайнов циклов агентов для Claude Code: от базовых вызовов до агентов, которые переписывают собственные промпты, с SVG-анимациями, показывающими механизмы памяти и циклов.

Сообщество OpenClaw: Поделитесь своей настройкой для программирования с ИИ и ежемесячными расходами
Тред на Reddit в сообществе r/openclaw собирает практические настройки для AI-агентов программирования, фокусируясь на стратегиях маршрутизации моделей, правилах экономии средств и сопоставлениях оборудования с моделями от сообщества с указанием ежемесячных диапазонов затрат.