Анализ расхода токенов в контекстном окне Claude на 1 млн: данные показывают неограниченный рост и накопление промахов кэша.

Анализ расхода токенов на основе реальных данных
Детальный анализ реализации контекстного окна Claude в 1 млн токенов выявил конкретные технические факторы, вызывающие быстрое потребление токенов. Автор проанализировал JSONL-файлы сессий из нескольких диалогов, чтобы выявить закономерности.
Ключевые выводы из данных
Неограниченный рост контекста: До внедрения контекстного окна в 1 млн токенов автоматическое уплотнение срабатывало примерно при 160 тыс. токенов. После внедрения 1 млн этот предел исчез, позволяя сессиям регулярно достигать 500+ тыс. токенов. Каждый запрос повторно отправляет весь контекст, что означает, что при 500 тыс. токенов даже простое подтверждение стоит 500 тыс. токенов. Если Claude делает 3 вызова инструментов для ответа на запрос, это 1,5 млн токенов за одно взаимодействие.
Накопление промахов кэша: Anthropic кэширует контекст на стороне сервера примерно на 5 минут. После этого окна следующий запрос повторно обрабатывает полный контекст примерно в 10 раз дороже, чем из кэша. Хотя частота промахов кэша не изменилась (оставаясь около 2,5% ходов), промах кэша при контексте в 500 тыс. токенов значительно дороже, чем при 150 тыс. токенов.
Инструмент анализа
Автор создал скрипт на Python, который анализирует количество токенов из JSONL-файлов сессий Claude без доступа к содержимому диалогов. Скрипт автоматически определяет вашу директорию данных Claude и требует matplotlib и numpy. Скрипт доступен по адресу: https://github.com/RyanSeanPhillips/cldctrl/blob/master/docs/context_analysis.py
Автор также упоминает CLD CTRL (https://github.com/RyanSeanPhillips/cldctrl), терминальную панель управления для запуска и мониторинга сессий Claude Code, использования токенов и активности проектов.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также
Настройки системы Claude Code v2.1.139: Документация платформы Claude на AWS, безопасность обобщения, инструменты PowerShell
CC 2.1.139 (+2 248 токенов): добавлены справочные документы Claude Platform на AWS с аутентификацией SigV4, безопасное обобщение разговоров с сохранением инструкций, таблица соответствия команд Unix и PowerShell, а также ряд улучшений навыков и промптов.

Meta представляет модель искусственного интеллекта BOxCrete для проектирования состава бетонных смесей.
Meta выпустила Bayesian Optimization for Concrete (BOxCrete) — модель искусственного интеллекта с открытым исходным кодом для разработки устойчивых бетонных смесей с использованием материалов американского производства. Модель улучшает предыдущие версии за счёт лучшей устойчивости к шумам и возможностей прогнозирования осадки конуса.

ИИ-пинг-понг: когда каждый ответ — скриншот ChatGPT
Разработчики сообщают, что их заваливают AI-сгенерированными ответами — от коллег, начальников и даже комментаторов на GitHub — которые игнорируют контекст и отнимают время. Обсуждение на Hacker News отражает растущее разочарование.

Клод 4.6 Opus способен воспроизвести list.h из Linux на основе минимальных входных данных
Пользователь продемонстрировал, что Claude 4.6 Opus может генерировать почти идентичную копию заголовочного файла list.h из Linux, получив первые 43 строки в качестве входных данных с температурой, установленной на 0, что поднимает вопросы о последствиях лицензирования GPL для моделей ИИ, обученных на открытом исходном коде.