Анализ 100 миллионов токенов в Claude Code показывает использование входных данных на 99,4%.

Разбивка использования токенов на основе отслеживания 100 млн токенов
Детальный анализ использования Claude Code отследил 1289 запросов в ходе продолжительных сессий программирования, в общей сложности около 100,9 млн токенов. Разбивка показывает значительный дисбаланс между входными и выходными токенами.
Распределение токенов:
- Входные токены: 100,3 млн (99,4% от общего количества)
- Закэшированные токены: 84,2 млн (84% от входных)
- Выходные токены: 616 тыс. (0,6% от общего количества)
Узкое место повторного чтения контекста
Claude Code тратит 99,4% своего токенного бюджета на чтение контекста и всего 0,6% на написание кода. Эта закономерность не характерна только для Claude Code, а отражает то, как в настоящее время работают все агентные системы программирования. Каждый раз, когда Claude Code выполняет действие — читает файл, запускает команду, редактирует код — ему требуется повторная подача полного контекста, включая структуру репозитория, историю диалога, результаты работы инструментов и журналы ошибок.
84 млн закэшированных токенов представляют собой один и тот же контекст, повторно отправляемый 1289 раз, потому что модель не имеет постоянной памяти между шагами. В отличие от разработчиков-людей, которые сохраняют ментальную модель своей кодовой базы, Claude Code следует шаблону: забыть всё → перечитать всё → написать код → снова забыть всё.
Ограничения кэширования промптов
Кэширование промптов от Anthropic делает этот процесс дешевле, но не быстрее. Узким местом является не скорость вывода — это цикл повторного чтения. Анализ предполагает, что реальным прорывом для Claude Code и агентного программирования в целом стала бы постоянная память проекта — не просто сохранённые факты через файлы памяти или CLAUDE.md, а сжатое, развивающееся понимание кодовой базы, которое переносится между сессиями.
Текущие системы по сути насильно добиваются интеллекта через повторяющийся контекст вместо построения понимания. День, когда это изменится, может сделать ИИ-программирование по-настоящему быстрее, устранив необходимость многократной обработки одной и той же информации.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

OpenAI разрабатывает альтернативу GitHub, сообщает Reuters.
Reuters сообщает, что OpenAI разрабатывает альтернативу GitHub от Microsoft, при этом история набрала 35 баллов и 12 комментариев на Hacker News.

Дилемма разработчика: соображения национальной безопасности ограничивают выбор открытых моделей
Разработчик, работающий с клиентами, чувствительными к вопросам национальной безопасности, сообщает о вынужденном выборе между устаревшими открытыми моделями США, такими как gpt-oss-120b, и более мощными китайскими моделями, такими как GLM и MiniMax, которые клиенты отвергают как угрозу национальной безопасности.

Заявления Великобритании об инвестициях в ИИ под сомнением: фиктивные дата-центры и неподтверждённое финансирование.
Расследование The Guardian выявило, что многомиллиардная программа Великобритании по развитию ИИ включает в себя «фантомные инвестиции» с арендованными дата-центрами, площадку для суперкомпьютера, которая до сих пор функционирует как склад строительных лесов, и неподтверждённые заявления о создании рабочих мест.

Исследование: ИИ «разбивает» рабочие места на более узкие и низкооплачиваемые задачи
Новая статья утверждает, что ИИ не уничтожает рабочие места напрямую, а «разбивает» их на более узкие задачи. В профессиях со слабой связностью задач это приводит к сокращению сферы деятельности и оплаты, тогда как в профессиях с сильной связностью могут наблюдаться улучшения производительности.