ИИ-агенты для кода: проблема контекста в больших базах

Проблема не в узком месте выполнения

Наблюдения за реальным использованием кодовых баз показывают, что ИИ-агенты для написания кода последовательно тратят значительное время на исследование, а не на выполнение. Каждый раз, когда агент приступает к новой задаче, он делает 15–20 вызовов инструментов для ознакомительных действий, включая:

Поиск маршрутов через grep
Чтение промежуточного ПО
Проверку типов

К тому времени, когда агент начинает писать код, он уже потратил значительную часть своего контекстного окна на исследовательскую работу.

Доказательства упрощённых подходов

Vercel продемонстрировал эту проблему с противоположной стороны, убрав 80% инструментов у своего агента и предоставив ему доступ к bash. Этот подход привёл к 100% точности, что говорит о том, что возможности выполнения не являются ограничивающим фактором.

Аналогично, Pi (минималистичный агент для написания кода) доказывает ту же точку всего с 4 инструментами и системным промптом, содержащим менее 1000 токенов.

Реальная проблема: управление контекстом

Если выполнение эффективно решено, то реальной сложной проблемой становится управление контекстом. Несколько факторов способствуют этой проблеме:

Большие кодовые базы не помещаются ни в одно текущее контекстное окно
Длительные задачи накапливают выводы инструментов, которые вытесняют ранние рассуждения из окна внимания
Динамические среды меняются между сессиями
Исследование «Lost in the Middle» показывает, что модели лучше всего рассуждают в начале своего контекстного окна — именно тогда, когда агенты всё ещё ищут

Автор опубликовал более подробный анализ, исследующий эти проблемы и их последствия для разработки ИИ-агентов для написания кода.

📖 Read the full source: r/LocalLLaMA

Агенты ИИ для написания кода испытывают трудности с управлением контекстом в больших кодовых базах.

Проблема не в узком месте выполнения

Доказательства упрощённых подходов

Реальная проблема: управление контекстом

👀 Смотрите также

Как подключить OpenClaw к Ollama удаленно

Мобильное приложение Cursor: управляйте своим код-агентом с телефона

Harmonic-9B: Двухэтапная дообученная модель Qwen3.5-9B для ИИ-агентов

Сотрудники Amazon высмеивают ИИ компании в Slack, называя его «Слоппенгеймер»