7-Файловый Уровень Управления для Предотвращения Дрейфа Сессий LLM

Разработчик на r/LocalLLaMA поделился решением, чтобы предотвратить тихую отмену архитектурных решений языковыми моделями-помощниками по программированию, такими как Claude, между сессиями. Вместо того чтобы рассматривать сессии языковых моделей как беседы, теперь они рассматривают их как процессы без состояния, которым нужен протокол.
Основная проблема
Каждая сессия языковой модели начинается с нулевой памяти. Вы заново объясняете, она заново интерпретирует и уверенно отклоняется. Разработчик отметил: "Вы даже не заметите, пока не окажетесь глубоко внутри проекта, может быть, на уровне трёх файлов, четырёх файлов или, кто знает, даже на последней части проекта."
Слой управления из 7 файлов
Решение — не лучший промпт, а слой управления, который любая модель может прочитать и сразу же начать работать в его рамках. Система использует семь файлов, каждый из которых отвечает за конкретную задачу без пересечений:
active_context.md— Контроллер сессии, определяет, что находится в фокусе прямо сейчасcontracts.md— Поведенческий закон, схемы данных, значения перечислений, требуемое поведениеagent_core.md— Дисциплина выполнения, как действовать, проверять, отчитыватьсяagent_project.md— Цель проекта, почему существует эта система, ожидаемые результатыdecisions.md— Журнал ADR, неочевидные решения и причины их принятияbuild_plan.md— Дорожная карта модулей, порядок реализации и результатыstate.md— Живой журнал, что сделано, что изменилось, что осталось
Ключевые проектные решения
Разработчик объяснил два критических разделения:
Разделение contracts.md и agent_core.md: "Когда возникал поведенческий конфликт, у модели не было способа понять, какому уровню отдать приоритет. Это было правило схемы или предпочтение выполнения? Когда они разделены, иерархия однозначна — контракты всегда побеждают."
Включение decisions.md: "Я почти пропустил его ('Я просто запомню'). Три недели спустя я не мог восстановить, почему мы выбрали Postgres вместо SQLite для конкретного модуля. Журнал ADR существует именно потому, что 'Я запомню' — это не протокол."
Операционный цикл
Каждая сессия следует этому порядку без исключений:
- Прочитать
active_context.md→ извлечь, что находится в фокусе - Перепроверить с
contracts.md→ поведенческие правила заблокированы - Подтвердить ограничения работы из
agent_core.md+agent_project.md - Проверить
decisions.md→ не отменять принятые решения - Выполнять только то, что разрешает
active_context.md, согласноbuild_plan.md - Проверить тестами — не объявлять завершённым без доказательств
- Обновить
state.mdс фактическими результатами - Если было принято новое нетривиальное решение, записать его в
decisions.md
Влияние на рабочий процесс
Блокировка области действия active_context.md оказалась особенно ценной: "До этого я начинал сессию, чтобы исправить ошибку, а затем заканчивал рефакторингом несвязанного модуля, потому что 'он был прямо здесь'. Казалось продуктивно.........и так и было."
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Настройка iTerm2 с 4 панелями для Claude Code CLI с разделением ролей ИИ
Разработчик создал четырёхпанельную настройку терминала iTerm2 специально для Claude Code CLI, чтобы решить проблемы с дрейфом контекста и предвзятостью самооценки. Каждая панель закреплена за определённой ролью с выделенными моделями и разрешениями.

Бенчмаркинг Nemotron 3 Super 120B с контекстом в 1 миллион токенов на M1 Ultra.
Пользователь протестировал Nemotron 3 Super 120B с квантованной моделью Q4_K_M, используя llama.cpp на M1 Ultra, достигнув контекстного окна в 1 миллион токенов, которое потребовало примерно 90 ГБ видеопамяти. Бенчмарки производительности показывают скорость генерации токенов от 255 т/с при обработке промпта в 512 токенов до 22,37 т/с при контексте в 100 000 токенов.

Обратно спроектированный SDK для Claude Code выпущен на четырех языках
Разработчик реверс-инженерил Claude Code и создал однодокументные SDK для Node.js, Python, Go и Rust без зависимостей. Инструменты предоставляют полный цикл агента с потоковой передачей и использованием инструментов, работая с существующими подписками Claude Pro/Max.

Тестирование показывает, что CLI-инструмент сокращает затраты на токены кода Claude на 32% благодаря структурной навигации.
Разработчик создал инструмент командной строки на Rust, который предоставляет агентам Claude Code команды структурной навигации, такие как 'покажи мне 180-токенное резюме этого 6000-токенного класса'. Бенчмаркинг на Sonnet 4.6 в 54 автоматизированных запусках показал снижение стоимости на 32% за задачу и на 67% больше правок кода за сессию.