Анализ 100 миллионов токенов в Claude Code показывает использование входных данных на 99,4%.

✍️ OpenClawRadar📅 Опубликовано: 9 марта 2026 г.🔗 Source
Анализ 100 миллионов токенов в Claude Code показывает использование входных данных на 99,4%.
Ad

Разбивка использования токенов на основе отслеживания 100 млн токенов

Детальный анализ использования Claude Code отследил 1289 запросов в ходе продолжительных сессий программирования, в общей сложности около 100,9 млн токенов. Разбивка показывает значительный дисбаланс между входными и выходными токенами.

Распределение токенов:

  • Входные токены: 100,3 млн (99,4% от общего количества)
  • Закэшированные токены: 84,2 млн (84% от входных)
  • Выходные токены: 616 тыс. (0,6% от общего количества)

Узкое место повторного чтения контекста

Claude Code тратит 99,4% своего токенного бюджета на чтение контекста и всего 0,6% на написание кода. Эта закономерность не характерна только для Claude Code, а отражает то, как в настоящее время работают все агентные системы программирования. Каждый раз, когда Claude Code выполняет действие — читает файл, запускает команду, редактирует код — ему требуется повторная подача полного контекста, включая структуру репозитория, историю диалога, результаты работы инструментов и журналы ошибок.

84 млн закэшированных токенов представляют собой один и тот же контекст, повторно отправляемый 1289 раз, потому что модель не имеет постоянной памяти между шагами. В отличие от разработчиков-людей, которые сохраняют ментальную модель своей кодовой базы, Claude Code следует шаблону: забыть всё → перечитать всё → написать код → снова забыть всё.

Ad

Ограничения кэширования промптов

Кэширование промптов от Anthropic делает этот процесс дешевле, но не быстрее. Узким местом является не скорость вывода — это цикл повторного чтения. Анализ предполагает, что реальным прорывом для Claude Code и агентного программирования в целом стала бы постоянная память проекта — не просто сохранённые факты через файлы памяти или CLAUDE.md, а сжатое, развивающееся понимание кодовой базы, которое переносится между сессиями.

Текущие системы по сути насильно добиваются интеллекта через повторяющийся контекст вместо построения понимания. День, когда это изменится, может сделать ИИ-программирование по-настоящему быстрее, устранив необходимость многократной обработки одной и той же информации.

📖 Прочитать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

OpenAI разрабатывает альтернативу GitHub, сообщает Reuters.
Новости

OpenAI разрабатывает альтернативу GitHub, сообщает Reuters.

Reuters сообщает, что OpenAI разрабатывает альтернативу GitHub от Microsoft, при этом история набрала 35 баллов и 12 комментариев на Hacker News.

OpenClawRadar
Дилемма разработчика: соображения национальной безопасности ограничивают выбор открытых моделей
Новости

Дилемма разработчика: соображения национальной безопасности ограничивают выбор открытых моделей

Разработчик, работающий с клиентами, чувствительными к вопросам национальной безопасности, сообщает о вынужденном выборе между устаревшими открытыми моделями США, такими как gpt-oss-120b, и более мощными китайскими моделями, такими как GLM и MiniMax, которые клиенты отвергают как угрозу национальной безопасности.

OpenClawRadar
Заявления Великобритании об инвестициях в ИИ под сомнением: фиктивные дата-центры и неподтверждённое финансирование.
Новости

Заявления Великобритании об инвестициях в ИИ под сомнением: фиктивные дата-центры и неподтверждённое финансирование.

Расследование The Guardian выявило, что многомиллиардная программа Великобритании по развитию ИИ включает в себя «фантомные инвестиции» с арендованными дата-центрами, площадку для суперкомпьютера, которая до сих пор функционирует как склад строительных лесов, и неподтверждённые заявления о создании рабочих мест.

OpenClawRadar
Исследование: ИИ «разбивает» рабочие места на более узкие и низкооплачиваемые задачи
Новости

Исследование: ИИ «разбивает» рабочие места на более узкие и низкооплачиваемые задачи

Новая статья утверждает, что ИИ не уничтожает рабочие места напрямую, а «разбивает» их на более узкие задачи. В профессиях со слабой связностью задач это приводит к сокращению сферы деятельности и оплаты, тогда как в профессиях с сильной связностью могут наблюдаться улучшения производительности.

OpenClawRadar