Аудит AI-агентов: 30 000+ токенов впустую на логах API

Разработчик на r/ClaudeAI проаудировал свои логи Anthropic API после того, как заметил взлетевший счет, и обнаружил ключевую неэффективность: ИИ-агенты не теряют рассудок — они задыхаются в собственном окне контекста. В посте описывается, как агенты в репозиториях размером более 10 000 строк тратят токены на слепое исследование, загрузку необработанных файлов и многословные выводы инструментов, что приводит к архитектурной лапше после 20+ шагов.

Ключевые выводы из аудита логов API

Слепое исследование: Агенты рекурсивно выполняют grep и читают ~40 файлов, чтобы найти одну функцию. Вместо поиска существующего UI-компонента они часто галлюцинируют дубликат с нуля.
Загрузка целиком: Агент может прочитать файл на 2000 строк, чтобы обновить интерфейс из 5 строк, тратя токены впустую.
Поток shell и инструментов: Многословные логи тестов и раздутые определения MCP-инструментов потребляют ~30 000 токенов до того, как агент напишет хоть строчку кода.
Память как у золотой рыбки: Каждая сессия заново читает те же файлы из-за отсутствия памяти о проекте — как в "Дне сурка".

Когда окно контекста заполняется этим шумом до ~80%, качество рассуждений агента заметно падает, и начинается архитектурная деградация. Стандартные RAG или сжатие вывода не устраняют коренную причину: у агента нет структурного понимания кодовой базы, пока он не сожжет токены на чтение сырого текста.

Практические последствия

Разработчики сталкиваются с парадоксом производительности: экономия часа на наборе текста оборачивается пятью часами исправления ИИ-спагетти-кода. В посте ставится вопрос о необходимости принципиально новой архитектуры агента, которая понимает код как граф до того, как тратить токены на сырой текст.

Для кого это

Инженеры, использующие ИИ-агентов для кодинга на больших кодовых базах, которые хотят понять скрытые потери токенов и повысить эффективность затрат.

📖 Читать полный источник: r/ClaudeAI

Аудит логов API показывает, что AI-агенты тратят токены впустую из-за раздувания контекстного окна

Ключевые выводы из аудита логов API

Практические последствия

Для кого это

👀 Смотрите также

Бенчмарки показывают, что дистиллированные модели соответствуют передовым LLM в структурированных задачах при 10-кратном снижении затрат.

ИИ слишком дорог: гиперскейлерам нужно 3 триллиона долларов, чтобы выйти в ноль

OpenClaw 2026.3.22-beta.1: Ключевые изменения в рабочем процессе для разработчиков плагинов и автоматизации браузера

Кими k2.5: Прокладывая новые пути в автоматизации ИИ