7-Файловый Уровень Управления для Предотвращения Дрейфа Сессий LLM

✍️ OpenClawRadar📅 Опубликовано: 13 апреля 2026 г.🔗 Source
7-Файловый Уровень Управления для Предотвращения Дрейфа Сессий LLM
Ad

Разработчик на r/LocalLLaMA поделился решением, чтобы предотвратить тихую отмену архитектурных решений языковыми моделями-помощниками по программированию, такими как Claude, между сессиями. Вместо того чтобы рассматривать сессии языковых моделей как беседы, теперь они рассматривают их как процессы без состояния, которым нужен протокол.

Основная проблема

Каждая сессия языковой модели начинается с нулевой памяти. Вы заново объясняете, она заново интерпретирует и уверенно отклоняется. Разработчик отметил: "Вы даже не заметите, пока не окажетесь глубоко внутри проекта, может быть, на уровне трёх файлов, четырёх файлов или, кто знает, даже на последней части проекта."

Слой управления из 7 файлов

Решение — не лучший промпт, а слой управления, который любая модель может прочитать и сразу же начать работать в его рамках. Система использует семь файлов, каждый из которых отвечает за конкретную задачу без пересечений:

  • active_context.md — Контроллер сессии, определяет, что находится в фокусе прямо сейчас
  • contracts.md — Поведенческий закон, схемы данных, значения перечислений, требуемое поведение
  • agent_core.md — Дисциплина выполнения, как действовать, проверять, отчитываться
  • agent_project.md — Цель проекта, почему существует эта система, ожидаемые результаты
  • decisions.md — Журнал ADR, неочевидные решения и причины их принятия
  • build_plan.md — Дорожная карта модулей, порядок реализации и результаты
  • state.md — Живой журнал, что сделано, что изменилось, что осталось
Ad

Ключевые проектные решения

Разработчик объяснил два критических разделения:

Разделение contracts.md и agent_core.md: "Когда возникал поведенческий конфликт, у модели не было способа понять, какому уровню отдать приоритет. Это было правило схемы или предпочтение выполнения? Когда они разделены, иерархия однозначна — контракты всегда побеждают."

Включение decisions.md: "Я почти пропустил его ('Я просто запомню'). Три недели спустя я не мог восстановить, почему мы выбрали Postgres вместо SQLite для конкретного модуля. Журнал ADR существует именно потому, что 'Я запомню' — это не протокол."

Операционный цикл

Каждая сессия следует этому порядку без исключений:

  1. Прочитать active_context.md → извлечь, что находится в фокусе
  2. Перепроверить с contracts.md → поведенческие правила заблокированы
  3. Подтвердить ограничения работы из agent_core.md + agent_project.md
  4. Проверить decisions.md → не отменять принятые решения
  5. Выполнять только то, что разрешает active_context.md, согласно build_plan.md
  6. Проверить тестами — не объявлять завершённым без доказательств
  7. Обновить state.md с фактическими результатами
  8. Если было принято новое нетривиальное решение, записать его в decisions.md

Влияние на рабочий процесс

Блокировка области действия active_context.md оказалась особенно ценной: "До этого я начинал сессию, чтобы исправить ошибку, а затем заканчивал рефакторингом несвязанного модуля, потому что 'он был прямо здесь'. Казалось продуктивно.........и так и было."

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Настройка iTerm2 с 4 панелями для Claude Code CLI с разделением ролей ИИ
Инструменты

Настройка iTerm2 с 4 панелями для Claude Code CLI с разделением ролей ИИ

Разработчик создал четырёхпанельную настройку терминала iTerm2 специально для Claude Code CLI, чтобы решить проблемы с дрейфом контекста и предвзятостью самооценки. Каждая панель закреплена за определённой ролью с выделенными моделями и разрешениями.

OpenClawRadar
Бенчмаркинг Nemotron 3 Super 120B с контекстом в 1 миллион токенов на M1 Ultra.
Инструменты

Бенчмаркинг Nemotron 3 Super 120B с контекстом в 1 миллион токенов на M1 Ultra.

Пользователь протестировал Nemotron 3 Super 120B с квантованной моделью Q4_K_M, используя llama.cpp на M1 Ultra, достигнув контекстного окна в 1 миллион токенов, которое потребовало примерно 90 ГБ видеопамяти. Бенчмарки производительности показывают скорость генерации токенов от 255 т/с при обработке промпта в 512 токенов до 22,37 т/с при контексте в 100 000 токенов.

OpenClawRadar
Обратно спроектированный SDK для Claude Code выпущен на четырех языках
Инструменты

Обратно спроектированный SDK для Claude Code выпущен на четырех языках

Разработчик реверс-инженерил Claude Code и создал однодокументные SDK для Node.js, Python, Go и Rust без зависимостей. Инструменты предоставляют полный цикл агента с потоковой передачей и использованием инструментов, работая с существующими подписками Claude Pro/Max.

OpenClawRadar
Тестирование показывает, что CLI-инструмент сокращает затраты на токены кода Claude на 32% благодаря структурной навигации.
Инструменты

Тестирование показывает, что CLI-инструмент сокращает затраты на токены кода Claude на 32% благодаря структурной навигации.

Разработчик создал инструмент командной строки на Rust, который предоставляет агентам Claude Code команды структурной навигации, такие как 'покажи мне 180-токенное резюме этого 6000-токенного класса'. Бенчмаркинг на Sonnet 4.6 в 54 автоматизированных запусках показал снижение стоимости на 32% за задачу и на 67% больше правок кода за сессию.

OpenClawRadar