Анализ 100 миллионов токенов в Claude Code показывает использование входных данных на 99,4%.

Разбивка использования токенов на основе отслеживания 100 млн токенов

Детальный анализ использования Claude Code отследил 1289 запросов в ходе продолжительных сессий программирования, в общей сложности около 100,9 млн токенов. Разбивка показывает значительный дисбаланс между входными и выходными токенами.

Распределение токенов:

Входные токены: 100,3 млн (99,4% от общего количества)
Закэшированные токены: 84,2 млн (84% от входных)
Выходные токены: 616 тыс. (0,6% от общего количества)

Узкое место повторного чтения контекста

Claude Code тратит 99,4% своего токенного бюджета на чтение контекста и всего 0,6% на написание кода. Эта закономерность не характерна только для Claude Code, а отражает то, как в настоящее время работают все агентные системы программирования. Каждый раз, когда Claude Code выполняет действие — читает файл, запускает команду, редактирует код — ему требуется повторная подача полного контекста, включая структуру репозитория, историю диалога, результаты работы инструментов и журналы ошибок.

84 млн закэшированных токенов представляют собой один и тот же контекст, повторно отправляемый 1289 раз, потому что модель не имеет постоянной памяти между шагами. В отличие от разработчиков-людей, которые сохраняют ментальную модель своей кодовой базы, Claude Code следует шаблону: забыть всё → перечитать всё → написать код → снова забыть всё.

Ограничения кэширования промптов

Кэширование промптов от Anthropic делает этот процесс дешевле, но не быстрее. Узким местом является не скорость вывода — это цикл повторного чтения. Анализ предполагает, что реальным прорывом для Claude Code и агентного программирования в целом стала бы постоянная память проекта — не просто сохранённые факты через файлы памяти или CLAUDE.md, а сжатое, развивающееся понимание кодовой базы, которое переносится между сессиями.

Текущие системы по сути насильно добиваются интеллекта через повторяющийся контекст вместо построения понимания. День, когда это изменится, может сделать ИИ-программирование по-настоящему быстрее, устранив необходимость многократной обработки одной и той же информации.

📖 Прочитать полный источник: r/ClaudeAI

Анализ 100 миллионов токенов в Claude Code показывает использование входных данных на 99,4%.

Разбивка использования токенов на основе отслеживания 100 млн токенов

Узкое место повторного чтения контекста

Ограничения кэширования промптов

👀 Смотрите также

Результаты тестирования на визуальное мышление для 15 мультимодальных моделей искусственного интеллекта

Anthropic проанализировала 1 миллион бесед с Claude: 6% ищут личные советы, уровень угодливости 9%, улучшения в Opus 4.7

Google Trends показывает рост поискового интереса к Claude Code в начале 2026 года.

Claude-Code версии 2.1.92 добавляет мастер настройки Bedrock, детализацию затрат и несколько исправлений.