Почему ИИ-агенты для кода выдают мусор после 20 итераций: слепота к контексту

✍️ OpenClawRadar📅 Опубликовано: 20 мая 2026 г.🔗 Source
Почему ИИ-агенты для кода выдают мусор после 20 итераций: слепота к контексту
Ad

Разработчик на r/LocalLLaMA провел аудит своих API-логов и полезной нагрузки промптов после того, как заметил рост расхода токенов и ухудшение выводов агента примерно после 20 шагов до уровня "каши". Его вывод: модели не деградируют; они задыхаются в собственных раздутых контекстных окнах.

Четыре структурные ошибки

Изучив, что Cursor и Claude Code на самом деле делают в репозитории на 10k+ строк, автор выявил четыре паттерна:

  • Слепое исследование: Агент рекурсивно делает grep и сбрасывает в контекст ~40 разных файлов, чтобы найти одну утилиту. Часто он упускает существующий компонент и галлюцинирует дубликат с нуля.
  • Сырое поглощение: Сброс файла на 2000 строк в промпт для обновления интерфейса из 5 строк. Трата огромного количества токенов контекста.
  • Инструментальный понос: Подробные логи тестов и массивные определения MCP-инструментов потребляют ~30k токенов до того, как модель сгенерирует хоть один токен кода.
  • Память золотой рыбки: Каждая сессия начинается с чистого листа — ноль осведомленности о проекте — поэтому одни и те же файлы читаются снова и снова.
Ad

Порог на 80% контекста

Как только контекст заполняется шумом примерно на 80% емкости, механизм внимания модели резко ухудшается. IQ заметно падает, и она начинает разрушать архитектуру. Стандартный RAG с чанкингом не исправляет ситуацию, потому что он бесполезен для логики — агент остается слеп к структуре кодовой базы, пока не сжигает токены на чтение сырого текста.

Предложенное исправление: AST или графовая БД

Автор призывает к созданию агента с открытым исходным кодом, который парсит код в AST или графовую базу данных до потребления контекста, чтобы он понимал структуру без траты токенов на сырой текст. Это предотвратит архитектурную лапшу, на исправление которой уходит 5 часов за каждый 1 час, сэкономленный на наборе кода.

Для кого это

Для разработчиков, использующих Cursor, Claude Code или локальные LLM-агенты для реальных кодовых баз и раздраженных парадоксами продуктивности.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Клод IDE Мост: Инструмент WebSocket для доступа к IDE в реальном времени
Инструменты

Клод IDE Мост: Инструмент WebSocket для доступа к IDE в реальном времени

claude-ide-bridge — это WebSocket-мост, который напрямую соединяет Claude Code с внутренним состоянием IDE, обеспечивая живую диагностику, переход к определению, поиск ссылок, всплывающие подсказки типов, открытие файлов, управление точками останова и потоковую передачу состояния отладчика.

OpenClawRadar
OpenCortex: Самообучающаяся система памяти для OpenClaw
Инструменты

OpenCortex: Самообучающаяся система памяти для OpenClaw

OpenCortex заменяет плоский файл MEMORY.md в OpenClaw структурированными файлами памяти, организованными по проектам, контактам, рабочим процессам, настройкам, руководствам, инструментам и инфраструктуре. Он включает ежедневную дистилляцию с аудитами соблюдения принципов и еженедельный синтез с обнаружением паттернов и автоматическим созданием руководств.

OpenClawRadar
Настройка локального голосового управления для AI-агентов на Apple Silicon
Инструменты

Настройка локального голосового управления для AI-агентов на Apple Silicon

Настройка локального голосового управления для ИИ-агентов с использованием Parakeet STT и Kokoro TTS на Apple Silicon для быстрого и независимого от облака взаимодействия.

OpenClawRadar
Приложение для многоагентных дебатов, созданное с использованием Claude, ElevenLabs и Flux
Инструменты

Приложение для многоагентных дебатов, созданное с использованием Claude, ElevenLabs и Flux

Разработчик создал приложение для дебатов, в котором Claude генерирует аргументы для двух персонажей на любую тему, а ИИ-судья оценивает и выбирает победителя. Приложение добавляет голос через ElevenLabs и изображения через Flux, создавая атмосферу дебатного шоу.

OpenClawRadar