Аудит логов API показывает, что AI-агенты тратят токены впустую из-за раздувания контекстного окна

Разработчик на r/ClaudeAI проаудировал свои логи Anthropic API после того, как заметил взлетевший счет, и обнаружил ключевую неэффективность: ИИ-агенты не теряют рассудок — они задыхаются в собственном окне контекста. В посте описывается, как агенты в репозиториях размером более 10 000 строк тратят токены на слепое исследование, загрузку необработанных файлов и многословные выводы инструментов, что приводит к архитектурной лапше после 20+ шагов.
Ключевые выводы из аудита логов API
- Слепое исследование: Агенты рекурсивно выполняют
grepи читают ~40 файлов, чтобы найти одну функцию. Вместо поиска существующего UI-компонента они часто галлюцинируют дубликат с нуля. - Загрузка целиком: Агент может прочитать файл на 2000 строк, чтобы обновить интерфейс из 5 строк, тратя токены впустую.
- Поток shell и инструментов: Многословные логи тестов и раздутые определения MCP-инструментов потребляют ~30 000 токенов до того, как агент напишет хоть строчку кода.
- Память как у золотой рыбки: Каждая сессия заново читает те же файлы из-за отсутствия памяти о проекте — как в "Дне сурка".
Когда окно контекста заполняется этим шумом до ~80%, качество рассуждений агента заметно падает, и начинается архитектурная деградация. Стандартные RAG или сжатие вывода не устраняют коренную причину: у агента нет структурного понимания кодовой базы, пока он не сожжет токены на чтение сырого текста.
Практические последствия
Разработчики сталкиваются с парадоксом производительности: экономия часа на наборе текста оборачивается пятью часами исправления ИИ-спагетти-кода. В посте ставится вопрос о необходимости принципиально новой архитектуры агента, которая понимает код как граф до того, как тратить токены на сырой текст.
Для кого это
Инженеры, использующие ИИ-агентов для кодинга на больших кодовых базах, которые хотят понять скрытые потери токенов и повысить эффективность затрат.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Анализ 2 181 конечных точек удаленных серверов MCP выявил проблемы с надежностью.
Автоматическая проверка работоспособности 2181 удалённых конечных точек серверов MCP показала, что только 9% из них подтверждены как работающие и исправные, 52% полностью неработоспособны, а 37% требуют аутентификации. Данные включают разбивку по категориям, измерения задержек и статистику доступности.

Первый в мире эксклюзив GitHub для ИИ-агентов запущен: Ограниченный бета-тест для 100 пользователей.
Разработан инновационный эксклюзив GitHub для AI-кодеров, с ограниченным бета-тестированием на 100 пользователей. Узнайте, как этот инструмент готов революционизировать сотрудничество в области ИИ.

Выпущен Claude Opus 4.7 с гибридным анализом и контекстным окном в 1 млн токенов.
Anthropic выпустила Claude Opus 4.7 — гибридную модель рассуждений с контекстным окном в 1 млн токенов, которая демонстрирует повышенную производительность в программировании, работе с визуальными данными и сложных многоэтапных задачах. Стоимость начинается от $5 за миллион входных токенов и $25 за миллион выходных токенов.

Экономика видео Sora AI: затраты OpenAI на вычисления составляют $65 при стоимости для пользователя в $20
По данным анализа приложения OpenAI Sora для генерации AI-видео, каждый подписчик за $20 в месяц, создающий 50 видео, обходится OpenAI примерно в $65 на вычисления. Чем больше пользователей взаимодействует с продуктом, тем быстрее он терял деньги.